From words to sentences: Advancing Turkish emotion analysis through emotion enrichment
Kelimelerden cümlelere: Duygu zenginleştirme ile Türkçe duygu analizini geliştirme
- Tez No: 845177
- Danışmanlar: DOÇ. DR. SENEM KUMOVA METİN
- Tez Türü: Doktora
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: İngilizce
- Üniversite: İzmir Ekonomi Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 152
Özet
Doğal dil işleme çalışmalarında dilin makineler tarafından anlaşılması, dilin doğru algılanması, veri kaynağındaki gerçek anlamın yakalanması ve duygusal nüansların ayırt edilmesi ihtiyacı nedenleriyle zorluklar içermektedir. Metinsel verileri temsil ederken mevcut kelime vektörleştirme modelleri anlamsal bilgilerin çıkarılmasında başarılıdır. Ancak bu modeller sıklıkla bir arada kullanılan kelimeleri vektör uzayında birbirine benzer şekilde temsil etmektedir. Bu nedenle, zıt duygulara sahip kelimeler, sık sık bir arada bulunmaları nedeniyle benzer vektör temsillerine sahip olabilir. Duygu tespitindeki bu tür eksikliklerin üstesinden gelmek için mevcut araştırmalar, duygusal bilgiler ekleyerek vektörleri zenginleştirmeye odaklanmaktadır. Vektör zenginleştirmede temel amaç, benzer semantik ve duygusal anlamlara sahip kelimelerin yakınlığını artırmak için vektör uzayını yeniden projekte etmektir. Bu çalışmada, iki semantik (Word2Vec ve GloVe) ve iki bağlamsal (BERT ve DistilBERT) vektörleştirme yöntemi kullanarak üç duygu zenginleştirme modeli Türkçe kelime ve cümlelere uygulanmıştır. Yapı itibariyle eklemeli bir dil olan Türkçenin bu bağlamda sıklıkla çalışılan diğer dillerden farklı sonuçlar üretmesi beklenmektedir. Sonuçlar, hem kelime hem de cümle düzeyinde zenginleştirmenin umut verici sonuçlarını göstermektedir. Zenginleştirilmiş cümle gösterimi literatürde ilk kez hem İngilizce hem de Türkçe dillerinde önerilmiştir. Ayrıca, herhangi bir dil ve vektör modeline uygulanabilen, duygu sözlüklerini filtreleme ve yüksek boyutlu vektörlerin boyutunu azaltarak duygusal bilgi içeren bölümleri belirleme amacını taşıyan bir optimizasyon yöntemi önerilmiştir. Deneysel sonuçlar, duygusal açıdan zenginleştirilmiş vektör temsillerinin orijinal modellerden daha iyi sonuçlar verdiğini göstermektedir.
Özet (Çeviri)
The comprehension of language by machines in natural language processing studies poses challenges due to the need for an accurate understanding of language, capturing the true meaning within the data source, and distinguishing emotional nuances. When representing textual data, current word vectorization models are successful in extracting semantic information. However, these models represent words that are often used together as similar to each other in vector space. Thus, words with opposite emotions may have similar vector representations because of their frequent co-occurrence. To overcome such deficiencies in emotion detection, current research focuses on enriching vectors by adding emotional information. In vector enrichment, the fundamental goal is to reproject the vector space to increase the proximity of words with similar semantic and emotional meanings. This study applies three emotion enrichment models to Turkish words and sentences, using two semantic (Word2Vec and GloVe) and two contextual (BERT and DistilBERT) vectorization methods. Turkish, an agglutinative language by structure, is expected to produce different results than other languages frequently studied in this context. The results demonstrate promising outcomes of enrichment at both the word and sentence levels. Enriched sentence representation was proposed for the first time in the literature in both English and Turkish languages. Moreover, an optimization method involving filtering the emotion lexicons and reducing the dimensionality of the high-dimensional vectors to discern parts containing emotional information is proposed which can be applied to any language and vector model. Experimental results indicate that emotionally enriched vector representations yield better results than original models.
Benzer Tezler
- آراء الكسائي النَّحوية والصَّرفيَّة في تفسير القُرطبيّجمعاً ودراسةً
El-Kisa'i'nin Kurtibi tefsirinde nahiv ve sarf görüşleri / al-Kisa'i's grammatical and morphological opinions in al-Qurtubi's interpretation: Collection and study
IMAN MUTLAG MUKHLIF MUKHLIF
Yüksek Lisans
Arapça
2023
DinÇankırı Karatekin ÜniversitesiTemel İslam Bilimleri Ana Bilim Dalı
DR. ÖĞR. ÜYESİ BEKİR YILDIRIM
- Text generation with recurrent neural networks
Yenilenen sinir ağları ile metin üretimi
MUSTAFA ABBAS HUSSEIN HUSSEIN
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÇankırı Karatekin ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. SERKAN SAVAŞ
- Farklı yükseklikte ölçülen rüzgar hızı verilerine trendsizleştirilmiş salınım analizinin uygulanması
The detrended fluctuation analysis to wind speed data measured at different heights
ECE UMUT KAYAALP
Yüksek Lisans
Türkçe
2022
Meteorolojiİstanbul Teknik ÜniversitesiMeteoroloji Mühendisliği Ana Bilim Dalı
PROF. DR. KASIM KOÇAK
- İzmit havzasının hidrojeoloji incelemesi ve yeraltısuyu akım modellemesi
An examination of the hydrogeology of the İzmit basin, and modelling of the groundwater flow
MERAL ERDOĞAN TOPÇUOĞLU
Doktora
Türkçe
2022
Jeoloji Mühendisliğiİstanbul Teknik ÜniversitesiJeoloji Mühendisliği Ana Bilim Dalı
PROF. DR. REMZİ KARAGÜZEL
- Tünellerde jeoloji kökenli stabilite sorunları İstanbul metrosu Şişhane örneği
Geological background of stability problems in tunnels example of metro of İstanbul Şişhane
İZZET ERKAN YILDIZEL
Yüksek Lisans
Türkçe
2001
Jeoloji Mühendisliğiİstanbul ÜniversitesiJeoloji Ana Bilim Dalı
DOÇ. DR. ALİ MALİK GÖZÜBOL