Geri Dön

Sentiment analysis for textual data

İngilizce metin verilerinin duygu analizi

  1. Tez No: 706394
  2. Yazar: HASSAN ABDIRAHMAN FARAH
  3. Danışmanlar: DR. ÖĞR. ÜYESİ ARZU KAKIŞIM
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2021
  8. Dil: İngilizce
  9. Üniversite: İstanbul Ticaret Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 39

Özet

Duygu analizi, müşterilerin bir ürüne, markaya, hizmete karşı tutum ve görüşlerini ortaya çıkarmak veya sosyal medya kullanıcılarının bir durum ve olaya tepkilerini analiz etmek için son zamanlarda sıkça çalışılan yaygın bir konu haline gelmiştir. Bu nedenle, birçok araştırmacı anlamsal sözcük, tümcecik veya paragraf puanlarını hesaplayan sözlükleri geliştirmeye odaklanmıştır. Kelimelere ait duyarlılık derecesini içeren çoğu sözlük manuel olarak oluşturulur ve insan uzmanlığı gerektirir. Terimleri etiketlemenin zorluğu nedeniyle, mevcut sözlükler genellikle yalnızca kelimelerden ve bunların duyarlılık kutuplarından oluşur. Bu nedenle, bir tümce veya paragraf için, bu sözlükler, metindeki tüm sözcüklerin puanlarını değerlendirerek ve genel (yaklaşık ortalama) bir puan hesaplayarak metnin duyarlılığının olumlu veya olumsuz olup olmadığına karar verir. Bu tezde, mevcut sözlüklerle n-gram yaklaşımını kullanan ve her bir görüşü veya incelemeyi sabit uzunlukta bir vektörle temsil eden yeni bir yaklaşım çerçevesi sunulmuştur. Amaç, ikili-gram veya üçlü-gram gibi her metnin çok kelimeli ifadelerinin anlamsal puanlarını içeren sıralı bir özellik alanı oluşturmaktır. Yöntemimiz, bir görüşü olumlu veya olumsuz olarak sınıflandırmak için bu özellik alanı üzerinde bir eğitim aşaması gerçekleştirir. Çoğu sözlük tabanlı yaklaşımdan farklı olarak, önerilen yöntem, metin duyarlılığı sınıflandırması için cümledeki sözcüklerin polarite değerlerinin yaklaşık ortalamasını kullanmak yerine, kelime öbeklerine ait gerçek değerli veya ikili değerli polarite puanları içeren ve metindeki sözcük sırasını koruyan bir öznitelik vektörü kullanır.

Özet (Çeviri)

Sentiment analysis has become a common topic that is frequently studied in recent times to reveal the attitudes and opinions of customers towards a product, brand, service, or to analyze the reactions of social media users to a situation and event. Therefore, many researchers have focused on enhancing lexicons that compute semantic scores of words, phrases, or paragraphs. Most sentiment lexicons are manually constructed, and requires human expertise. Due to the difficulty of labeling terms, existing lexicons generally consist of only words (unigrams) and their sentiment polarities. Therefore, for a sentence (or a paragraph), these lexicons decide whether the sentiment of text is positive or negative by evaluating the scores of all words in that text and computing an overall (approximately average) score. In this thesis, a new sentiment analysis framework is presented which uses n-gram approach with existing lexicons, and represents each opinion or review with a fixed-length vector. The aim is to create a sequential feature space containing the semantic scores of multi-word expressions of each text in the corpus such as bi-grams or tri-grams. Our method performs a training phase over this feature space to classify an opinion as positive or negative. Different from most lexicon based approach, the proposed method utilizes an attribute vector containing real-valued or binary-valued polarity scores and preserving word order in the text, instead of using approximate average of the polarity assessments of the words in the sentence for sentiment classification.

Benzer Tezler

  1. Sentiment analysis and classification of tweets based on machine learning

    Makine öğrenimine göre tweetlerin duygu analizi ve sınıflandırılması

    FIRAS FADHIL SHIHAB SHIHAB

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKarabük Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ DURSUN EKMEKCİ

  2. Türkçe hedef tabanlı duygu analizi için alt görevlerin incelenmesi–hedef terim, hedef kategori ve duygu sınıfı belirleme

    Inspecting sub tasks of aspect based sentiment analysis in Turkish language–opinion target expression, aspect category and sentiment polarity detection

    FATİH SAMET ÇETİN

    Yüksek Lisans

    Türkçe

    Türkçe

    2017

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. GÜLŞEN ERYİĞİT

  3. Çevrimiçi otel değerlendirme yorumları için transformatör tabanlı duygu analizi çerçevesi

    Transformer-based sentiment analysis framework for online hotel reviews

    FIQI AMALI

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKocaeli Üniversitesi

    Bilişim Sistemleri Mühendisliği Ana Bilim Dalı

    PROF. DR. HALİL YİĞİT

  4. Metin sınıflandırma teknikleri ile türkçe twitter duygu analizi

    Turkish twitter sentiment analysis using text classification techniques

    ÖNDER ÇOBAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2016

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAtatürk Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. GÜLŞAH TÜMÜKLÜ ÖZYER

  5. A comparative study of classification algorithms for sentiment analysis of COVID-19 vaccine opinions using machine learning

    Makine öğrenmeyi kullanarak COVID-19 aşı görüşlerinin duyarlılık analizi için sınıflandırma algoritmalarının karşılaştırmalı bir çalışması

    DILBER S ZAINULABDEEN ZAINULABDEEN

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAltınbaş Üniversitesi

    Elektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MESUT ÇEVİK