Targeted sentiment analysis on Turkish texts
Türkçe metinlerde hedef odaklı duygu analizi
- Tez No: 731394
- Danışmanlar: DOÇ. DR. ARZUCAN ÖZGÜR TÜRKMEN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: İngilizce
- Üniversite: Boğaziçi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 71
Özet
Duygu Analizi, metinden öznel bir bilgiyi elde etmeyi amaçlayan bir Doğal Dil İşleme görevidir. İnternetin, ve dolayısıyla sosyal medyanın, ulaşılabilirliğinin artması insanların büyük miktarlarda metinsel veri üretmesine olanak sağladı. Bu veriler içlerinde çıkarılmayı bekleyen değerli bilgiler barındırıyor olabilir. Duygu analizi bu bilgiyi çıkarmaya odakalanan ve zamanla da popüler olan bir alandır. Bütün metnin duygusunun, o metinde geçen bir hedefe karşı olan duyguyu yansıtmadığı durumlar söz konusu olabilir. Hedef Odaklı Duygu Analizi verilen bir metinden verilen bir hedef kelimeye yönelik olan duyguyu çıkarmayı amaçlar. İngilizce metinlerde duygu analizi çokça çalışılan bir alandır ve çoğunlukla eğitim için insan eliyle işaretlenmiş veriler gereklidir. Türkçe gibi dillerde böyle işaretlenmiş verilerin eksikliği görülür. Bu çalışmanın kapsamında, duygu analizi ve hedef odaklı duygu analizi için işaretlenmiş bir veri kümesi sunuyoruz. Bu veri kümesi yaklaşık 4 bin adet hem duygu analizi hem de hedef odaklı duygu analizi görevlerine göre işaretlenmiş cümle içeriyor. Bu önerilen veri kümesi Türkçe metinlerde hedef odaklı duygu analizi modeli eğitmemize olanak sağlıyor. Önerilen BERT tabanlı modellerimizden bir tanesi temel model olarak, diğerleri ise bu temel modeli geliştirmek üzere eğitilmiştir. Farklı BERT tabanlı model mimarilerinin bu görev için performansını inceliyoruz. Geleneksel duygu analizi modellerinin performansının hedef odaklı duygu analizi görevinde düştüğünü gözlemliyoruz. En iyi sonuç veren hedef belirteçli ve maksimum havuz katmanlı modellerimiz geleneksel BERT tabanlı duygu analizi modellerinden %13 daha iyi F1 skoru verdiğini gözlemliyoruz.
Özet (Çeviri)
Sentiment Analysis (SA) is one of the Natural Language Processing (NLP) tasks whose goal is to understand subjective information from a piece of text. The increased accessibility to the Internet and thus to social media leads people to create an enormous amount of textual data. This data can store valuable information that waits to be extracted. Targeted Sentiment Analysis (TSA) specifically aims to extract sentiment towards a particular target from a given text. Sentiment analysis in English texts is a well-studied area and mainly requires human-annotated data for training. For languages such as Turkish, there is a lack of such annotated data. In the context of this study, we introduce an annotated dataset that consists of Twitter data in Turkish. It contains almost 4K sentences that are labeled for both sentiment analysis and targeted sentiment analysis. The proposed dataset allows us to train a TSA model on Turkish texts. We propose BERT-based models with different architectures, one of which is to be used as our baseline for TSA and the others are to improve this baseline. We observe that the performance of conventional SA models degrades when used for TSA data. We investigate the performance of several BERT-based architectures for this task. Our best performing model with target markers and max-pooling layer outperforms the F1-score of conventional BERT-based SA models by 13%.
Benzer Tezler
- Public perception towards children's COVID-19 vaccination with natural language processing
Doğal dil işlemeyle çocukların COVID-19 aşısına ilişkin kamuoyu algısı
ELİF DELİCE
Yüksek Lisans
İngilizce
2022
Mühendislik Bilimleriİstanbul Medipol ÜniversitesiSağlık Sistemleri Mühendisliği Ana Bilim Dalı
PROF. DR. HAKAN TOZAN
DR. ÖĞR. ÜYESİ MELİS ALMULA KARADAYI
- Biyosürfaktan üreten bakterilerin denizel çevrelerden izolasyonu ve moleküler karakterizasyonu
Isolation and molecular characterization of biosurfactant producing bacteria from marine environments
SEDA GÜLLÜ
Yüksek Lisans
Türkçe
2024
MikrobiyolojiEge ÜniversitesiBiyoloji Ana Bilim Dalı
PROF. DR. HÜSNİYE TANSEL YALÇIN
- Otomatik duygu sözlüğü çevirimi ve duygu analizinde kullanımı
Automatic sentiment dictionary translation and using in sentiment analysis
ALAETTİN UÇAN
Yüksek Lisans
Türkçe
2014
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe ÜniversitesiBilgisayar Bilimleri Ana Bilim Dalı
PROF. DR. HAYRİ SEVER
DOÇ. DR. EBRU AKCAPINAR SEZER
- Global goals, local voices: A multinational comparative sentiment and topic analysis of public transportation in the context of SDGs
Küresel hedefler, yerel sesler: Sürdürülebilir kalkınma amaçları bağlamında toplu taşımaya yönelik ülkelerin karşılaştırmalı duygu ve konu analizi
ASLIGÜL AKSAN
Yüksek Lisans
İngilizce
2024
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesiİşletme Mühendisliği Ana Bilim Dalı
PROF. DR. HATİCE CAMGÖZ AKDAĞ
- İnternet ortamındaki müşteri yorumlarının fikir madenciliği ile analiz edilmesine yönelik bir çalışma
A study to analyze customers on the internet by using opinion mining
MUSTAFA ERDOĞMUŞ
Yüksek Lisans
Türkçe
2019
Endüstri ve Endüstri MühendisliğiSüleyman Demirel ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
PROF. DR. GÜLTEKİN ÖZDEMİR