Makine öğrenmesi yöntemleri ile twıtter verileri üzerinde duygu analizi ve tahminlemesi
Sentiment analysis and prediction on twitter data using machine learning methods
- Tez No: 960231
- Danışmanlar: DOÇ. DR. ATINÇ YILMAZ
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2025
- Dil: Türkçe
- Üniversite: İSTANBUL BEYKENT ÜNİVERSİTESİ
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
- Sayfa Sayısı: 99
Özet
Bu çalışmada, metin tabanlı veriler üzerinde duygu analizi gerçekleştirerek makine öğrenmesi algoritmaları ile tahminleme yapabilen bir uygulama geliştirilmiştir. Uygulama Phyton programlama diliyle geliştirilmiştir. Çalışmada Kaggle platformundan elde edilen ve İngilizce tweetlerden oluşan büyük bir veri setinden rastgele fakat homojen seçilen 10.000 veri kullanılmıştır. Bu verilerin %70'i eğitim, %30'u test amacıyla ayrılmış ve sadece pozitif ve negatif duygu etiketine sahip örnekler modele dahil edilmiştir. Veri ön işleme sürecinde URL, özel karakter, emoji ve gereksiz kelimeler temizlenmiş, ardından kelimeler köklerine indirgenmiştir. Temizlenen veriler TF-IDF yöntemiyle sayısal vektörlere dönüştürülmüş ve n-gram teknikleriyle yapılandırılmıştır. SVM, Random Forest ve Naive Bayes algoritmaları tekil olarak uygulanmış, ayrıca PCA, Kmeans ve Ki-Kare gibi yöntemlerle hibrit modeller geliştirilmiştir. GridSearchCV yöntemi ile en uygun parametreler belirlenerek toplamda 9 farklı model oluşturulmuştur. Model performansları karşılaştırıldığında, hibrit modellerin tekil modellere kıyasla daha yüksek doğruluk oranları sağladığı görülmüştür. Elde edilen sonuçlar, metin madenciliği ve duygu analizi çalışmalarında makine öğrenmesi algoritmalarının etkinliğini göstermiştir. Bu çalışma, farklı modelleme stratejileri sunarak gelecekte yapılacak çalışmalara katkı sağlamayı amaçlamıştır.
Özet (Çeviri)
In this study, an application capable of performing sentiment analysis on text-based data and making predictions using machine learning algorithms was developed. The application was implemented using the Python programming language. A randomly but homogeneously selected subset of 10,000 data points was used from a large dataset of English tweets obtained from the Kaggle platform. Of these data, 70% were allocated for training and 30% for testing, including only examples labeled with positive and negative sentiments. During the data preprocessing stage, URLs, special characters, emojis, and unnecessary words were removed, and words were reduced to their root forms. The cleaned data were converted into numerical vectors using the TF-IDF method and structured with n-gram techniques. The algorithms SVM, Random Forest, and Naive Bayes were applied individually, and hybrid models were also developed using methods such as PCA, Kmeans, and Chi-Squared. By utilizing the GridSearchCV method, the optimal parameters were determined, resulting in the creation of a total of nine different models. When the model performances were compared, it was observed that the hybrid models achieved higher accuracy rates compared to the individual models. The results demonstrated the effectiveness of machine learning algorithms in text mining and sentiment analysis. This study aims to contribute to future research by presenting various modeling strategies.
Benzer Tezler
- Sosyal ağ verileri kullanılarak Türkiye'nin duygu analizinin görselleştirilmesi
Visualization of the sentiment analysis of Turkey using social network data
MUSTAFA GÖÇENOĞLU
Yüksek Lisans
Türkçe
2014
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKarabük ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. İLKER TÜRKER
- Understanding twitter users' behaviour by social network analysis during disasters
Afet durumunda twıtter kullanıcılarının sosyal ağ analizi ile davranışını anlama
GÖZDE MERVE DEMİRCİ
Yüksek Lisans
İngilizce
2020
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
PROF. DR. ŞULE ITIR SATOĞLU
DOÇ. DR. GÜLÜSTAN DOĞAN
- Kelime kullanım oranları ve kullanıcı istatistikleri kullanılarak Türkçe Twitter verisi üzerinde duygu analizi
Sentiment analysis on Turkish Twitter data using term usage rates and user statistics
CEM GÜMÜŞ
Yüksek Lisans
Türkçe
2017
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolDoğuş ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. SELİM AKYOKUŞ
- Cryptocurrency price prediction by using social media data
Makine öğrenmesi teknikleri kullanılarak sosyal medya verileri ile kripto para fiyat tahmini
ÖZLEM GÜL PAMUK
Yüksek Lisans
İngilizce
2019
Bilim ve Teknolojiİstanbul Teknik ÜniversitesiBilişim Uygulamaları Ana Bilim Dalı
DOÇ. DR. SEFER BADAY
- Sosyal Ağlarda Duygu Analizi için Hibrit Bir Yöntem Geliştirilmesi
Development of a Hybrid Method for Sentiment Analysis in Social Networks
MUHAMMET SİNAN BAŞARSLAN
Doktora
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolDüzce ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ FATİH KAYAALP