Developing a Turkish sentiment lexicon using tone distributions
Ton dağılımları kullanan Türkçe duygu sözlüğü geliştirilmesi
- Tez No: 798095
- Danışmanlar: DOÇ. DR. BURKAY GENÇ
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Duygu analizi, Doğal Dil İşleme, duygu sözlüğü, polarite, istatiksel dağılım, Sentiment analysis, Natural Language Processing, lexicon, polarity, statistical distribution
- Yıl: 2022
- Dil: İngilizce
- Üniversite: Hacettepe Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 61
Özet
Gelişen teknoloji ve internet kullanımının artmasıyla birlikte birçok veri kaynağı araştırmacıların kullanımına açılmıştır. Bu verilerden anlamlı bilgilerin çıkarılması ve analiz edilmesi Doğal Dil İşleme (DDİ) alanında bir araştırma konusudur. DDİ'nin bir alt alanı olan duygu analizi, verilerin içeriğini, verdiği görüşe göre olumlu veya olumsuz olarak değerlendirir. Çoğu duygu analizi araştırması, iki yaklaşımdan biri kullanılarak yapılır: sözlük tabanlı ve makine öğrenimi tabanlı. Sözlük tabanlı yaklaşım, daha sonra bir metni değerlendirmek için kullanılan olumlu ve olumsuz kelimelerden oluşan bir sözlüğe ihtiyaç duyar. İngilizce'de çok sayıda çalışma olmasına rağmen Türkçe için aynı şeyi söylemek pek de mümkün değildir. Bu nedenle, bu çalışmada kapsamlı ve doğru bir Türkçe duygu sözlüğü oluşturmak amaçlanmıştır. Bu çalışma kapsamında, ana akım Türk haber ajanslarından elde edilen kapsamlı bir döküman bütünü kullanılarak ve hesaplanan istatistiksel ton yoğunluğu fonksiyonunu kullanarak yeni bir metodolojiyle Türkçe duygu sözlüğü geliştirmeyi amaçlıyoruz. Bu sayede literatürde ilk kez bu yöntem kullanılarak Türkçe duygu sözlüğü geliştirilmiştir. Bu sözlük, kelimelere yalnızca ikili polariteler yerine ton değerleri atamakla kalmaz, aynı zamanda literatürdeki diğer yaklaşımlarla genellikle mümkün olmayan daha keskin ton değerleri elde edilmesini sağlar. Bu çalışmada, elde ettiğimiz sözlüğün performansını literatürdeki benzer sözlüklerle karşılaştırmalı olarak değerlendiriyoruz. Sonuçlar oluşturulan duygu sözlüğünün karşılaştırılabilir bir performansa ulaştığını ve birçok potansiyel iyileştirme olanağı sunduğunu göstermektedir.
Özet (Çeviri)
With the developing technology and increasing use of the internet, many sources of data have been exposed to researchers. Analysis and extraction of meaningful information from this data is a research topic under the field of natural language processing. Sentiment analysis which is a sub-field of NLP evaluates the content of data with respect to the opinion it conveys as one of positive or negative. Most sentiment analysis research is done using one of two approaches: lexicon based and machine learning based. Lexicon based approach needs a dictionary of positive and negative words which is then used to evaluate a text. Although there are abundance of studies in English, the same can not be claimed for Turkish. Therefore, in our study, we focus on constructing a comprehensive and accurate Turkish sentiment lexicon. In this paper, we aim to develop a Turkish sentiment lexicon with a novel methodology: using statistical tone density functions computed using a very large document corpus obtained from mainstream Turkish news agencies. In this way, for the first time in the literature, a Turkish sentiment lexicon is created by using this method. The lexicon not only assigns tone values instead of boolean polarities, but also provides sharper tones which is usually not possible with other approaches in the literature. We evaluate the performance of this lexicon in comparison with similar lexicons in the literature. Results show that the constructed sentiment lexicon in this study achieves a comparable performance and poses many potential improvement possibilities.
Benzer Tezler
- Developing a comprehensive emotion lexicon for Turkish
Türkçe için kapsamlı bir duygu sözlüğü geliştirilmesi
ELİF ÜNAL
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. BURKAY GENÇ
- Developing a comprehensive framework for sentiment analysis in Turkish
Türkçe için kapsamlı bir duygu analizi çatısı geliştirme
CEM RIFKI AYDIN
Doktora
İngilizce
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. TUNGA GÜNGÖR
PROF. DR. SADIK FİKRET GÜRGEN
DR. ÖĞR. ÜYESİ TEVFİK AYTEKİN
- Sosyal ağlar üzerinde ontoloji tabanlı sezgi analizi için bir uygulama çatısının geliştirilmesi
Developing a framework for ontology based sentiment analysis on social media
KADİR TUTAR
Yüksek Lisans
Türkçe
2013
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEge ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. LEVENT TOKER
- Portfolio optimization with sentiment analysis
Yaklaşım analizi ile portföy optimizasyonu
AHMET ERARSLAN
Yüksek Lisans
İngilizce
2024
Endüstri ve Endüstri MühendisliğiBoğaziçi ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
PROF. DR. AHMET REFİK GÜLLÜ
- Developing the recurrent neural network with long-short term memory and word2vec representation for sentiment classification
Duygu sınıflandırma için uzun kısa süreli bellek ve word2vec temsilcisi ile yenileme neural ağının geliştirilmesi
FALAH AMER ABDULAZEEZ AL-KUBAISI
Yüksek Lisans
İngilizce
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÇankaya ÜniversitesiBilgi Teknolojileri Ana Bilim Dalı
Assist. Prof. Dr. ABDÜL KADİR GÖRÜR