Geri Dön

Aktif öğrenmeyi kullanarak çeşitli veri kümeleri üzerinde duygu analizi

Sentiment analysis on various datasets using active learning

  1. Tez No: 919200
  2. Yazar: YAVUZ SELİM TEPELİ
  3. Danışmanlar: PROF. DR. İSMAİL KADAYIF
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2025
  8. Dil: Türkçe
  9. Üniversite: Çanakkale Onsekiz Mart Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 73

Özet

Kullanıcıların görüşlerini, tercihlerini ve duygularını içeren öznel metinleri araştırarak, analiz ederek ve çıkarım yaparak kullanıcıların tutum ve görüşlerini olumlu, olumsuz veya belirli bir gruba ait olup olmadığını belirlemek için duygu analizi yöntemi kullanılmaktadır. Duygu analizi çalışmalarında başarıyı etkileyen faktörlerden biri duygu sınıfı etiketlenmiş veri setidir. Veri seçimi aşamasında aktif öğrenme algoritmalarının uygulanmasının amacı, gereğinden fazla veri işaretlemek ve sağlamak zorunda kalmadan mümkün olduğunca iyi bir sınıflandırma yapmaktır. Az etiketli veri kullanarak duygu analizlerinde yüksek doğruluk elde etmeyi ve böylece etiketli verileri elde etmenin maliyetini ve süresini en aza indirmek hedeflenmektedir. Bu çalışmada Stanford Sentiment Treebank Binary, Tweet Eval Emotions ve Go Emotions veri setleri kullanılmıştır. Veri seçim aşamasında Random, Long First, Least Confidence Sampling, Margin Sampling ve Entropy Sampling aktif öğrenme yaklaşımları karşılaştırılmıştır. Duygu analizi ise Decision Tree, Logistic Regression, Naive Bayes Classifier, Support Vector Machine, Random Forest, Convolutional Neural Network ve Long Short-Term Memory ile gerçekleştirilmiştir. Bulgularımıza göre Decision Tree, Logistic Regression, Naive Bayes Classifier ve Support Vector Machine makine öğrenmesi yöntemleri derin öğrenme kategorisindeki Convolutional Neural Network ve Long Short-Term Memory yöntemlerine göre duygu analizinde daha başarılı tahminler yapabilmektedir. Ayrıca aktif öğrenmede veri seçim yönteminin doğruluk oranlarına etki ettiği de tespit edilmiştir. Örneğin, Least Confidence Sampling veya Entropy Sampling veri seçiminde aktif öğrenmenin performansı Stanford Sentiment Treebank Binary veri kümesi için rastgele veri seçim performansına göre yaklaşık %7 daha iyi olduğu bulunmuştur.

Özet (Çeviri)

The sentiment analysis method is used to identify whether users' attitudes and opinions are positive, negative, or neutral by examining and evaluating subjective texts that express users' opinions, preferences, and feelings. A key factor influencing the success of sentiment analysis studies is the availability of sentiment class-labeled datasets. The aim of applying active learning algorithms during the data selection stage is to achieve accurate classification while minimizing the need for excessive labeled data. This approach seeks to enhance accuracy in sentiment analysis by utilizing fewer labeled samples, thereby reducing the cost and time associated with obtaining this data. In this study, we employed three datasets: the Stanford Sentiment Treebank Binary, Tweet Eval Emotions, and Go Emotions. We compared various active learning methods for data selection, including Random Sampling, Longest First Sampling, Least Confidence Sampling, Margin Sampling, and Entropy Sampling. We conducted sentiment analysis using several machine learning algorithms: Decision Tree, Logistic Regression, Naive Bayes Classifier, Support Vector Machine, Random Forest, and deep learning methods such as Convolutional Neural Networks and Long Short-Term Memory. Our findings indicate that Decision Tree, Logistic Regression, Naive Bayes Classifier, and Support Vector Machine methods yield more accurate predictions in sentiment analysis compared to the Convolutional Neural Network and Long Short-Term Memory approaches. Additionally, the data selection method used in active learning significantly impacts accuracy rates. For example, the performance of active learning in Least Confidence Sampling or Entropy Sampling data selection was found to be approximately 7% better than the performance of data selection for the Stanford Sentiment Treebank Binary dataset.

Benzer Tezler

  1. Derin öğrenme ile cerrahi video anlama

    Surgical video understanding with deep learning

    ABDISHAKOUR ABDILLAHI AWALE ABDISHAKOUR ABDILLAHI AWALE

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilişim Sistemleri Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ DUYGU SARIKAYA

  2. Comparison of feature selection and extraction methods and active learning in voice based emotion recognition systems

    Ses duygu tanıma sistemlerinde aktif öğrenme ve öznitelik seçme ve çıkarma yöntemlerinin karşılaştırılması

    TOLGA ATALAY

    Yüksek Lisans

    İngilizce

    İngilizce

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ YUSUF YASLAN

  3. Using co-training to empower active learning

    Aktif öğrenmeyi güçlendirmek için eş-öğrenme kullanılması

    PAYAM VAKILZADEH AZAD

    Yüksek Lisans

    İngilizce

    İngilizce

    2017

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. YUSUF YASLAN

  4. Brain-inspired cortical-coding algorithm for multimedia processing

    Multimedya işlemek için beyinden esinlenilmiş kortikal kodlama algoritması

    AHMET EMİN ÜNAL

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. BURAK BERK ÜSTÜNDAĞ

  5. CNN-based text-independent automatic speaker identification

    Evrişimsel sinir ağı tabanlı metinden bağımsız otomatik konuşmacı tanılama

    MANDANA FASOUNAKI

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ GÖKHAN İNCE