Affect analysis of communication texts in Turkish language
Türkçe iletişim metinleri üzerine duygulanım analizi
- Tez No: 433969
- Danışmanlar: YRD. DOÇ. DR. ALBERT ALİ SALAH
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2016
- Dil: İngilizce
- Üniversite: Boğaziçi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Hesaplamalı Bilimler ve Mühendislik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 105
Özet
Dijital teknolojilerin çevrimiçi iletişim yelpazemizi genişletmesiyle birlikte, metin- sel duygulanım (afekt) analizi bir çok disiplinde önemli bir ilgi odağı haline gelmiştir. Bu alanda İngilizce dili üzerine birçok çalışma yapılmış olsa da, Türkçe diline yönelik oldukça kısıtlı sayıda çalışma bulunmaktadır. Bunun bir nedeni duygulanım analizi için gereken sözlüksel (lexical) kaynakların ve sistem değerlendirmesi için gerekli olan referans derlemlerin (corpora) yetersiz olmasıdır. Bu çalışmada, birçok aracı birleştirerek Türkçe iletişim metinlerinin sürekli ve boyutsal duygulanım analizini gerçekleştirecek bir yaklaşım sunuyoruz. Twitter verisi, film eleştirileri ve lise öğrencilerine yönelik öğretmen yorumları, çevrimiçi sohbet ve psikoterapi kayıtları gibi birçok Türkçe derlemler üzerinde bu modeli test ettik. Çevrimiçi sohbet kayıtlarını analiz etmek, dilbilgisel düzensizlikler, kısaltmalar, yazım yanlışları ve yapısal olmayan bir dil kullanımı gibi sorunları da beraberinde getirmektedir. Bu problemlerin üstesinden gelebilmek amacıyla birçok ön veri işleme tekniği gerçekleştirdik. Sonrasında, İngilizce için hazırlanmış bir duygulanımsal kelime sözlüğünü Türkçe'ye adapte ederek ve eş anlamlı kelime gruplarıyla genişleterek, memnuniyet (valence), uyarılma düzeyi (arousal) ve baskınlık (dominance) boyutları için ölçeklendirilmiş 15,200 kelimelik bir kaynak elde ettik. Aynı zamanda, bir cümlenin genel duygulanım durumunu yakalayabilmek için sık kullanılan kısaltmaların, emotikonların, özel isimlerin, pekiştirici kelimelerin birer listesini bazı dilsel sinyallerle birlikte kullandık. Sohbet kayıtları üzerine duygulanımsal bir değerlendirme refaransı oluşturabilmek için bir cümle işaretleme anketi düzenledik. Son olarak elde ettiğimiz sonuçlar kural ve kelime bazlı modelimizin faydalı olduğunu göstermekle birlikte birçok farklı aşama hala geliştirilmeye açıktır.
Özet (Çeviri)
As digital technologies expanded our range of online communication, textual affect analysis become the focus of considerable interest in several disciplines. While many studies have been conducted in English language, there are only a few tools specific for the Turkish language. One reason for that is the lack of lexical resources for affect analysis and annotated corpora for an accurate evaluation. In this thesis, we develop an approach for continuous and dimensional affect analysis of Turkish communications by combining several tools. We conduct experiments on various text corpora in Turkish including online multi-party chat records, psychotherapy records, Twitter data, movie reviews, and teachers' comments on high school students. Analyzing such texts brings challenges like non-standard word usage, grammatical irregularities, abbreviation usage, and spelling mistakes. We propose several pre-processing steps to deal with these. Then, we adapt an affective word dictionary from English to Turkish, and by expanding it with synsets, obtain 15,200 words with annotations for valence, arousal, and dominance. We also employ a list of frequently used abbreviations, emoticons, interjections, modifiers (intensifiers and diminishers), and other linguistic indicators to capture the overall affective state at the sentence level. We recruit and train annotators to obtain affective ground truth specifically for multi-party chat records. Our results show that the proposed system is useful, yet there is much room for improvement at different stages.
Benzer Tezler
- Die superlative als ausdrucksform in den antrittsreden der Türkischen Premierminister und Deutschen Bundeskanzler seit gründung der Republik Türkei und der Bundesrepublik Deutschland. ein beitrag zur semantischen, lexikologischen, soziolinguistischen und politolinguistischen analyse
Kuruluşlarından itibaren Türkiye Cumhuriyeti ve Federal Almanya Cumhuriyeti Başbakanlarının ve Şansölyelerinin açılış konuşmalarındaki derecelendirme sıfatlarının söz sanatı olarak kullanımı. anlambilimsel, sözcükbilimsel, sosyodilbilimsel ve politikdilbilimsel bir analiz
ONUR YILMAZ
Doktora
Almanca
2014
Alman Dili ve EdebiyatıHacettepe ÜniversitesiAlman Dili ve Edebiyatı Ana Bilim Dalı
DOÇ. DR. NİHAT ÜLNER
- Türkçede değer biçilmiş anlam: Türkçe dersi kitaplarında sıfatların kullanımı
Appraisal meaning in Turkish: The use of adjectives in context of Turkish
AYTEN BÜLBÜL
- Hikâye kitaplarında dilin şiddet aracı olarak kullanımı: Ömer Seyfettin örneği
The use of language as a tool of violence in story books: Ömer Seyfettin example
SİBEL KAYA
Yüksek Lisans
Türkçe
2019
Eğitim ve ÖğretimMuğla Sıtkı Koçman ÜniversitesiTürkçe Eğitimi Ana Bilim Dalı
DOÇ. DR. HATİÇE FIRAT
- L'analyse semiotique des traductions de l'œuvre intitulée Les Misérables de Victor Hugo dans le contexte Turc du point de vue de la sémiotique de la traduction
Vıctor Hugo'nun Sefiller adlı romanının Türkçe çevirilerinin göstergebilimsel analizi
SERPİL ÖZBÜKER
Yüksek Lisans
Fransızca
2024
Fransız Dili ve EdebiyatıGalatasaray ÜniversitesiFransız Dili ve Edebiyatı Ana Bilim Dalı
PROF. DR. SÜNDÜZ ÖZTÜRK KASAR
- Avustralya'da yaşayan Türklerin dil görünümlerinin iki dillilik bağlamında incelenmesi
Examination of language outlook of the Turks living in Australia within the context of bilingualism
HAMİDE MERVE ALTIPARMAK YILMAZ
Doktora
Türkçe
2020
DilbilimGazi ÜniversitesiTürkçe ve Sosyal Bilimler Eğitimi Ana Bilim Dalı
PROF. DR. NECATİ DEMİR