Geri Dön

Targeted sentiment analysis on Turkish texts

Türkçe metinlerde hedef odaklı duygu analizi

  1. Tez No: 731394
  2. Yazar: MUSTAFA MELİH MUTLU
  3. Danışmanlar: DOÇ. DR. ARZUCAN ÖZGÜR TÜRKMEN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: İngilizce
  9. Üniversite: Boğaziçi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 71

Özet

Duygu Analizi, metinden öznel bir bilgiyi elde etmeyi amaçlayan bir Doğal Dil İşleme görevidir. İnternetin, ve dolayısıyla sosyal medyanın, ulaşılabilirliğinin artması insanların büyük miktarlarda metinsel veri üretmesine olanak sağladı. Bu veriler içlerinde çıkarılmayı bekleyen değerli bilgiler barındırıyor olabilir. Duygu analizi bu bilgiyi çıkarmaya odakalanan ve zamanla da popüler olan bir alandır. Bütün metnin duygusunun, o metinde geçen bir hedefe karşı olan duyguyu yansıtmadığı durumlar söz konusu olabilir. Hedef Odaklı Duygu Analizi verilen bir metinden verilen bir hedef kelimeye yönelik olan duyguyu çıkarmayı amaçlar. İngilizce metinlerde duygu analizi çokça çalışılan bir alandır ve çoğunlukla eğitim için insan eliyle işaretlenmiş veriler gereklidir. Türkçe gibi dillerde böyle işaretlenmiş verilerin eksikliği görülür. Bu çalışmanın kapsamında, duygu analizi ve hedef odaklı duygu analizi için işaretlenmiş bir veri kümesi sunuyoruz. Bu veri kümesi yaklaşık 4 bin adet hem duygu analizi hem de hedef odaklı duygu analizi görevlerine göre işaretlenmiş cümle içeriyor. Bu önerilen veri kümesi Türkçe metinlerde hedef odaklı duygu analizi modeli eğitmemize olanak sağlıyor. Önerilen BERT tabanlı modellerimizden bir tanesi temel model olarak, diğerleri ise bu temel modeli geliştirmek üzere eğitilmiştir. Farklı BERT tabanlı model mimarilerinin bu görev için performansını inceliyoruz. Geleneksel duygu analizi modellerinin performansının hedef odaklı duygu analizi görevinde düştüğünü gözlemliyoruz. En iyi sonuç veren hedef belirteçli ve maksimum havuz katmanlı modellerimiz geleneksel BERT tabanlı duygu analizi modellerinden %13 daha iyi F1 skoru verdiğini gözlemliyoruz.

Özet (Çeviri)

Sentiment Analysis (SA) is one of the Natural Language Processing (NLP) tasks whose goal is to understand subjective information from a piece of text. The increased accessibility to the Internet and thus to social media leads people to create an enormous amount of textual data. This data can store valuable information that waits to be extracted. Targeted Sentiment Analysis (TSA) specifically aims to extract sentiment towards a particular target from a given text. Sentiment analysis in English texts is a well-studied area and mainly requires human-annotated data for training. For languages such as Turkish, there is a lack of such annotated data. In the context of this study, we introduce an annotated dataset that consists of Twitter data in Turkish. It contains almost 4K sentences that are labeled for both sentiment analysis and targeted sentiment analysis. The proposed dataset allows us to train a TSA model on Turkish texts. We propose BERT-based models with different architectures, one of which is to be used as our baseline for TSA and the others are to improve this baseline. We observe that the performance of conventional SA models degrades when used for TSA data. We investigate the performance of several BERT-based architectures for this task. Our best performing model with target markers and max-pooling layer outperforms the F1-score of conventional BERT-based SA models by 13%.

Benzer Tezler

  1. Public perception towards children's COVID-19 vaccination with natural language processing

    Doğal dil işlemeyle çocukların COVID-19 aşısına ilişkin kamuoyu algısı

    ELİF DELİCE

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Mühendislik Bilimleriİstanbul Medipol Üniversitesi

    Sağlık Sistemleri Mühendisliği Ana Bilim Dalı

    PROF. DR. HAKAN TOZAN

    DR. ÖĞR. ÜYESİ MELİS ALMULA KARADAYI

  2. Biyosürfaktan üreten bakterilerin denizel çevrelerden izolasyonu ve moleküler karakterizasyonu

    Isolation and molecular characterization of biosurfactant producing bacteria from marine environments

    SEDA GÜLLÜ

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    MikrobiyolojiEge Üniversitesi

    Biyoloji Ana Bilim Dalı

    PROF. DR. HÜSNİYE TANSEL YALÇIN

  3. Otomatik duygu sözlüğü çevirimi ve duygu analizinde kullanımı

    Automatic sentiment dictionary translation and using in sentiment analysis

    ALAETTİN UÇAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2014

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe Üniversitesi

    Bilgisayar Bilimleri Ana Bilim Dalı

    PROF. DR. HAYRİ SEVER

    DOÇ. DR. EBRU AKCAPINAR SEZER

  4. Global goals, local voices: A multinational comparative sentiment and topic analysis of public transportation in the context of SDGs

    Küresel hedefler, yerel sesler: Sürdürülebilir kalkınma amaçları bağlamında toplu taşımaya yönelik ülkelerin karşılaştırmalı duygu ve konu analizi

    ASLIGÜL AKSAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    İşletme Mühendisliği Ana Bilim Dalı

    PROF. DR. HATİCE CAMGÖZ AKDAĞ

  5. İnternet ortamındaki müşteri yorumlarının fikir madenciliği ile analiz edilmesine yönelik bir çalışma

    A study to analyze customers on the internet by using opinion mining

    MUSTAFA ERDOĞMUŞ

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Endüstri ve Endüstri MühendisliğiSüleyman Demirel Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    PROF. DR. GÜLTEKİN ÖZDEMİR