Geri Dön

Developing a Turkish sentiment lexicon using tone distributions

Ton dağılımları kullanan Türkçe duygu sözlüğü geliştirilmesi

  1. Tez No: 798095
  2. Yazar: MUAZZEZ ŞULE KARAŞLAR
  3. Danışmanlar: DOÇ. DR. BURKAY GENÇ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Duygu analizi, Doğal Dil İşleme, duygu sözlüğü, polarite, istatiksel dağılım, Sentiment analysis, Natural Language Processing, lexicon, polarity, statistical distribution
  7. Yıl: 2022
  8. Dil: İngilizce
  9. Üniversite: Hacettepe Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 61

Özet

Gelişen teknoloji ve internet kullanımının artmasıyla birlikte birçok veri kaynağı araştırmacıların kullanımına açılmıştır. Bu verilerden anlamlı bilgilerin çıkarılması ve analiz edilmesi Doğal Dil İşleme (DDİ) alanında bir araştırma konusudur. DDİ'nin bir alt alanı olan duygu analizi, verilerin içeriğini, verdiği görüşe göre olumlu veya olumsuz olarak değerlendirir. Çoğu duygu analizi araştırması, iki yaklaşımdan biri kullanılarak yapılır: sözlük tabanlı ve makine öğrenimi tabanlı. Sözlük tabanlı yaklaşım, daha sonra bir metni değerlendirmek için kullanılan olumlu ve olumsuz kelimelerden oluşan bir sözlüğe ihtiyaç duyar. İngilizce'de çok sayıda çalışma olmasına rağmen Türkçe için aynı şeyi söylemek pek de mümkün değildir. Bu nedenle, bu çalışmada kapsamlı ve doğru bir Türkçe duygu sözlüğü oluşturmak amaçlanmıştır. Bu çalışma kapsamında, ana akım Türk haber ajanslarından elde edilen kapsamlı bir döküman bütünü kullanılarak ve hesaplanan istatistiksel ton yoğunluğu fonksiyonunu kullanarak yeni bir metodolojiyle Türkçe duygu sözlüğü geliştirmeyi amaçlıyoruz. Bu sayede literatürde ilk kez bu yöntem kullanılarak Türkçe duygu sözlüğü geliştirilmiştir. Bu sözlük, kelimelere yalnızca ikili polariteler yerine ton değerleri atamakla kalmaz, aynı zamanda literatürdeki diğer yaklaşımlarla genellikle mümkün olmayan daha keskin ton değerleri elde edilmesini sağlar. Bu çalışmada, elde ettiğimiz sözlüğün performansını literatürdeki benzer sözlüklerle karşılaştırmalı olarak değerlendiriyoruz. Sonuçlar oluşturulan duygu sözlüğünün karşılaştırılabilir bir performansa ulaştığını ve birçok potansiyel iyileştirme olanağı sunduğunu göstermektedir.

Özet (Çeviri)

With the developing technology and increasing use of the internet, many sources of data have been exposed to researchers. Analysis and extraction of meaningful information from this data is a research topic under the field of natural language processing. Sentiment analysis which is a sub-field of NLP evaluates the content of data with respect to the opinion it conveys as one of positive or negative. Most sentiment analysis research is done using one of two approaches: lexicon based and machine learning based. Lexicon based approach needs a dictionary of positive and negative words which is then used to evaluate a text. Although there are abundance of studies in English, the same can not be claimed for Turkish. Therefore, in our study, we focus on constructing a comprehensive and accurate Turkish sentiment lexicon. In this paper, we aim to develop a Turkish sentiment lexicon with a novel methodology: using statistical tone density functions computed using a very large document corpus obtained from mainstream Turkish news agencies. In this way, for the first time in the literature, a Turkish sentiment lexicon is created by using this method. The lexicon not only assigns tone values instead of boolean polarities, but also provides sharper tones which is usually not possible with other approaches in the literature. We evaluate the performance of this lexicon in comparison with similar lexicons in the literature. Results show that the constructed sentiment lexicon in this study achieves a comparable performance and poses many potential improvement possibilities.

Benzer Tezler

  1. Developing a comprehensive emotion lexicon for Turkish

    Türkçe için kapsamlı bir duygu sözlüğü geliştirilmesi

    ELİF ÜNAL

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. BURKAY GENÇ

  2. Developing a comprehensive framework for sentiment analysis in Turkish

    Türkçe için kapsamlı bir duygu analizi çatısı geliştirme

    CEM RIFKI AYDIN

    Doktora

    İngilizce

    İngilizce

    2020

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. TUNGA GÜNGÖR

    PROF. DR. SADIK FİKRET GÜRGEN

    DR. ÖĞR. ÜYESİ TEVFİK AYTEKİN

  3. Sosyal ağlar üzerinde ontoloji tabanlı sezgi analizi için bir uygulama çatısının geliştirilmesi

    Developing a framework for ontology based sentiment analysis on social media

    KADİR TUTAR

    Yüksek Lisans

    Türkçe

    Türkçe

    2013

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEge Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. LEVENT TOKER

  4. Portfolio optimization with sentiment analysis

    Yaklaşım analizi ile portföy optimizasyonu

    AHMET ERARSLAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Endüstri ve Endüstri MühendisliğiBoğaziçi Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    PROF. DR. AHMET REFİK GÜLLÜ

  5. Developing the recurrent neural network with long-short term memory and word2vec representation for sentiment classification

    Duygu sınıflandırma için uzun kısa süreli bellek ve word2vec temsilcisi ile yenileme neural ağının geliştirilmesi

    FALAH AMER ABDULAZEEZ AL-KUBAISI

    Yüksek Lisans

    İngilizce

    İngilizce

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÇankaya Üniversitesi

    Bilgi Teknolojileri Ana Bilim Dalı

    Assist. Prof. Dr. ABDÜL KADİR GÖRÜR