Geri Dön

Makine öğrenmesi yöntemleri ile twıtter verileri üzerinde duygu analizi ve tahminlemesi

Sentiment analysis and prediction on twitter data using machine learning methods

  1. Tez No: 960231
  2. Yazar: ALİ KAĞAN ÇİFTDEMİR
  3. Danışmanlar: DOÇ. DR. ATINÇ YILMAZ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2025
  8. Dil: Türkçe
  9. Üniversite: İSTANBUL BEYKENT ÜNİVERSİTESİ
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 99

Özet

Bu çalışmada, metin tabanlı veriler üzerinde duygu analizi gerçekleştirerek makine öğrenmesi algoritmaları ile tahminleme yapabilen bir uygulama geliştirilmiştir. Uygulama Phyton programlama diliyle geliştirilmiştir. Çalışmada Kaggle platformundan elde edilen ve İngilizce tweetlerden oluşan büyük bir veri setinden rastgele fakat homojen seçilen 10.000 veri kullanılmıştır. Bu verilerin %70'i eğitim, %30'u test amacıyla ayrılmış ve sadece pozitif ve negatif duygu etiketine sahip örnekler modele dahil edilmiştir. Veri ön işleme sürecinde URL, özel karakter, emoji ve gereksiz kelimeler temizlenmiş, ardından kelimeler köklerine indirgenmiştir. Temizlenen veriler TF-IDF yöntemiyle sayısal vektörlere dönüştürülmüş ve n-gram teknikleriyle yapılandırılmıştır. SVM, Random Forest ve Naive Bayes algoritmaları tekil olarak uygulanmış, ayrıca PCA, Kmeans ve Ki-Kare gibi yöntemlerle hibrit modeller geliştirilmiştir. GridSearchCV yöntemi ile en uygun parametreler belirlenerek toplamda 9 farklı model oluşturulmuştur. Model performansları karşılaştırıldığında, hibrit modellerin tekil modellere kıyasla daha yüksek doğruluk oranları sağladığı görülmüştür. Elde edilen sonuçlar, metin madenciliği ve duygu analizi çalışmalarında makine öğrenmesi algoritmalarının etkinliğini göstermiştir. Bu çalışma, farklı modelleme stratejileri sunarak gelecekte yapılacak çalışmalara katkı sağlamayı amaçlamıştır.

Özet (Çeviri)

In this study, an application capable of performing sentiment analysis on text-based data and making predictions using machine learning algorithms was developed. The application was implemented using the Python programming language. A randomly but homogeneously selected subset of 10,000 data points was used from a large dataset of English tweets obtained from the Kaggle platform. Of these data, 70% were allocated for training and 30% for testing, including only examples labeled with positive and negative sentiments. During the data preprocessing stage, URLs, special characters, emojis, and unnecessary words were removed, and words were reduced to their root forms. The cleaned data were converted into numerical vectors using the TF-IDF method and structured with n-gram techniques. The algorithms SVM, Random Forest, and Naive Bayes were applied individually, and hybrid models were also developed using methods such as PCA, Kmeans, and Chi-Squared. By utilizing the GridSearchCV method, the optimal parameters were determined, resulting in the creation of a total of nine different models. When the model performances were compared, it was observed that the hybrid models achieved higher accuracy rates compared to the individual models. The results demonstrated the effectiveness of machine learning algorithms in text mining and sentiment analysis. This study aims to contribute to future research by presenting various modeling strategies.

Benzer Tezler

  1. Sosyal ağ verileri kullanılarak Türkiye'nin duygu analizinin görselleştirilmesi

    Visualization of the sentiment analysis of Turkey using social network data

    MUSTAFA GÖÇENOĞLU

    Yüksek Lisans

    Türkçe

    Türkçe

    2014

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKarabük Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. İLKER TÜRKER

  2. Understanding twitter users' behaviour by social network analysis during disasters

    Afet durumunda twıtter kullanıcılarının sosyal ağ analizi ile davranışını anlama

    GÖZDE MERVE DEMİRCİ

    Yüksek Lisans

    İngilizce

    İngilizce

    2020

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    PROF. DR. ŞULE ITIR SATOĞLU

    DOÇ. DR. GÜLÜSTAN DOĞAN

  3. Kelime kullanım oranları ve kullanıcı istatistikleri kullanılarak Türkçe Twitter verisi üzerinde duygu analizi

    Sentiment analysis on Turkish Twitter data using term usage rates and user statistics

    CEM GÜMÜŞ

    Yüksek Lisans

    Türkçe

    Türkçe

    2017

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolDoğuş Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. SELİM AKYOKUŞ

  4. Cryptocurrency price prediction by using social media data

    Makine öğrenmesi teknikleri kullanılarak sosyal medya verileri ile kripto para fiyat tahmini

    ÖZLEM GÜL PAMUK

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Bilim ve Teknolojiİstanbul Teknik Üniversitesi

    Bilişim Uygulamaları Ana Bilim Dalı

    DOÇ. DR. SEFER BADAY

  5. Sosyal Ağlarda Duygu Analizi için Hibrit Bir Yöntem Geliştirilmesi

    Development of a Hybrid Method for Sentiment Analysis in Social Networks

    MUHAMMET SİNAN BAŞARSLAN

    Doktora

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolDüzce Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ FATİH KAYAALP