Aktif öğrenmeyi kullanarak çeşitli veri kümeleri üzerinde duygu analizi
Sentiment analysis on various datasets using active learning
- Tez No: 919200
- Danışmanlar: PROF. DR. İSMAİL KADAYIF
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2025
- Dil: Türkçe
- Üniversite: Çanakkale Onsekiz Mart Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 73
Özet
Kullanıcıların görüşlerini, tercihlerini ve duygularını içeren öznel metinleri araştırarak, analiz ederek ve çıkarım yaparak kullanıcıların tutum ve görüşlerini olumlu, olumsuz veya belirli bir gruba ait olup olmadığını belirlemek için duygu analizi yöntemi kullanılmaktadır. Duygu analizi çalışmalarında başarıyı etkileyen faktörlerden biri duygu sınıfı etiketlenmiş veri setidir. Veri seçimi aşamasında aktif öğrenme algoritmalarının uygulanmasının amacı, gereğinden fazla veri işaretlemek ve sağlamak zorunda kalmadan mümkün olduğunca iyi bir sınıflandırma yapmaktır. Az etiketli veri kullanarak duygu analizlerinde yüksek doğruluk elde etmeyi ve böylece etiketli verileri elde etmenin maliyetini ve süresini en aza indirmek hedeflenmektedir. Bu çalışmada Stanford Sentiment Treebank Binary, Tweet Eval Emotions ve Go Emotions veri setleri kullanılmıştır. Veri seçim aşamasında Random, Long First, Least Confidence Sampling, Margin Sampling ve Entropy Sampling aktif öğrenme yaklaşımları karşılaştırılmıştır. Duygu analizi ise Decision Tree, Logistic Regression, Naive Bayes Classifier, Support Vector Machine, Random Forest, Convolutional Neural Network ve Long Short-Term Memory ile gerçekleştirilmiştir. Bulgularımıza göre Decision Tree, Logistic Regression, Naive Bayes Classifier ve Support Vector Machine makine öğrenmesi yöntemleri derin öğrenme kategorisindeki Convolutional Neural Network ve Long Short-Term Memory yöntemlerine göre duygu analizinde daha başarılı tahminler yapabilmektedir. Ayrıca aktif öğrenmede veri seçim yönteminin doğruluk oranlarına etki ettiği de tespit edilmiştir. Örneğin, Least Confidence Sampling veya Entropy Sampling veri seçiminde aktif öğrenmenin performansı Stanford Sentiment Treebank Binary veri kümesi için rastgele veri seçim performansına göre yaklaşık %7 daha iyi olduğu bulunmuştur.
Özet (Çeviri)
The sentiment analysis method is used to identify whether users' attitudes and opinions are positive, negative, or neutral by examining and evaluating subjective texts that express users' opinions, preferences, and feelings. A key factor influencing the success of sentiment analysis studies is the availability of sentiment class-labeled datasets. The aim of applying active learning algorithms during the data selection stage is to achieve accurate classification while minimizing the need for excessive labeled data. This approach seeks to enhance accuracy in sentiment analysis by utilizing fewer labeled samples, thereby reducing the cost and time associated with obtaining this data. In this study, we employed three datasets: the Stanford Sentiment Treebank Binary, Tweet Eval Emotions, and Go Emotions. We compared various active learning methods for data selection, including Random Sampling, Longest First Sampling, Least Confidence Sampling, Margin Sampling, and Entropy Sampling. We conducted sentiment analysis using several machine learning algorithms: Decision Tree, Logistic Regression, Naive Bayes Classifier, Support Vector Machine, Random Forest, and deep learning methods such as Convolutional Neural Networks and Long Short-Term Memory. Our findings indicate that Decision Tree, Logistic Regression, Naive Bayes Classifier, and Support Vector Machine methods yield more accurate predictions in sentiment analysis compared to the Convolutional Neural Network and Long Short-Term Memory approaches. Additionally, the data selection method used in active learning significantly impacts accuracy rates. For example, the performance of active learning in Least Confidence Sampling or Entropy Sampling data selection was found to be approximately 7% better than the performance of data selection for the Stanford Sentiment Treebank Binary dataset.
Benzer Tezler
- Derin öğrenme ile cerrahi video anlama
Surgical video understanding with deep learning
ABDISHAKOUR ABDILLAHI AWALE ABDISHAKOUR ABDILLAHI AWALE
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilişim Sistemleri Ana Bilim Dalı
DR. ÖĞR. ÜYESİ DUYGU SARIKAYA
- Comparison of feature selection and extraction methods and active learning in voice based emotion recognition systems
Ses duygu tanıma sistemlerinde aktif öğrenme ve öznitelik seçme ve çıkarma yöntemlerinin karşılaştırılması
TOLGA ATALAY
Yüksek Lisans
İngilizce
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ YUSUF YASLAN
- Using co-training to empower active learning
Aktif öğrenmeyi güçlendirmek için eş-öğrenme kullanılması
PAYAM VAKILZADEH AZAD
Yüksek Lisans
İngilizce
2017
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. YUSUF YASLAN
- Brain-inspired cortical-coding algorithm for multimedia processing
Multimedya işlemek için beyinden esinlenilmiş kortikal kodlama algoritması
AHMET EMİN ÜNAL
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. BURAK BERK ÜSTÜNDAĞ
- CNN-based text-independent automatic speaker identification
Evrişimsel sinir ağı tabanlı metinden bağımsız otomatik konuşmacı tanılama
MANDANA FASOUNAKI
Yüksek Lisans
İngilizce
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ GÖKHAN İNCE