Geri Dön

Sentiment analysis of twitter texts using machine learning algorithms

Makine öğrenme algoritmaları kullanılan twitter metinlerinin duygu analizi

  1. Tez No: 682241
  2. Yazar: HAWAR SAMEEN ALI AL-BARZENJI
  3. Danışmanlar: DR. ÖĞR. ÜYESİ VEYSEL HARUN ŞAHİN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2021
  8. Dil: İngilizce
  9. Üniversite: Sakarya Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar ve Bilişim Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 78

Özet

Bu tezde, veri seti şeklinde kaydedilen Trump'ın tweet'leri kazınmış web sayfası üzerinde doğal dil işleme ve makine öğrenmesi sınıflandırıcılarının kullanımı olarak duygu analizi incelenmiştir. Veri hazırlandıktan sonra, ana bilgisayar veri setine en önemli duygu analizi prosedürleri uygulanmıştır. Ayrıca, metin vektörleştirmeye hazır olmak için veri kümesini temizlemek gibi diğer doğal dil işleme stratejileri de işlenmiştir. Metinsel verilerin temizlenmesinde, istenmeyen kelimelerin kaldırılması için stopwords kaldırma, kelime lemmatization, düzenli ifade ve tokenization gibi gerekli tüm teknikler kullanılmıştır. Daha az kapasite alma hedefi ile veri setindeki“içerik”özelliğinin boyutunu küçültmeyi başardık. Son yirmi yılda sosyal medya ağlarının gelişmesiyle birlikte nefret dolu faaliyetler bir fenomen haline geldi, bu, her birinin yayınlanan metninin öznel kutuplarını bilmek zorlu bir görev haline geldi; bu nedenle, her cümle, olumlu, olumsuz veya tarafsız olup olmadığı kutuplarına göre yargılanmıştır. Sonunda (Random Forest sınıflandırıcı, Gaussian Naive Bayes ve Support Vector Machine) gibi makine öğrenme algoritmaları kullanılarak temizlenen veriler eğitilmiş ve tahmin sonuçlarının doğruluğunu görmek için test edilmiştir, 88%, 72% ve her sınıflandırıcı için sırasıyla 89%.

Özet (Çeviri)

In this thesis, sentiment analysis as the use of natural language processing and machine learning classifiers have been studied on Trump's tweets scraped web page, which is saved in the form of dataset. After data preparation, the most important sentiment analysis procedures have been applied to the host dataset. Also, other natural language processing strategies have been processed, like cleaning the dataset in order to be ready for text vectorization. In cleaning the textual data, all the required techniques like removing stopwords, word lemmatization, regular expression, and tokenization have been used to remove undesired words. We succeeded in reducing the size of the“content”feature in the dataset with the target of taking fewer capacity. Since the two last decades with the development of social media networks, hateful activities have become a phenomenon, this became a challenging task to know the subjective polarities of each one's published text; therefore, each sentence has been judged-on regarding their polarities whether they are positive, negative or neutral. At the end, by using machine learning algorithms like (Random Forest classifier, Gaussian Naive Bayes, and Support Vector Machine), the cleaned data has been trained and tested to see the accuracy of the prediction results, the comparison shows 88%, 72%, and 89% respectively for each classifier.

Benzer Tezler

  1. Makine öğrenmesi yöntemleri kullanılarak uzaktan eğitim konulu Türkçe tweetlerin duygu analizi

    Turkish tweets on distance education using machine learning methods sentiment analysis

    ALİ CAN AKDENİZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKonya Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. İSMAİL BABAOĞLU

  2. Türkçe metinlerde duygu analizi

    Sentiment analysis in Turkish texts

    CUMALİ TÜRKMENOĞLU

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. AHMET CÜNEYD TANTUĞ

  3. Portfolio optimization with sentiment analysis

    Yaklaşım analizi ile portföy optimizasyonu

    AHMET ERARSLAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Endüstri ve Endüstri MühendisliğiBoğaziçi Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    PROF. DR. AHMET REFİK GÜLLÜ

  4. Sentiment analysis in data of twitter using machine learning algorithms

    HESSDS analizlerinin twitter verilerinde Keullehiler makensi algoritme lerenin òğrenimi

    MUSTAFA AHMED MAHMOOD

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAltınbaş Üniversitesi

    Bilişim Teknolojileri Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ SEFER KURNAZ

  5. İngilizce ve Türkçe twitter mesajlarının Word2Vec modeli ile sınıflandırılması

    Classification of English and Turkish twitter messages by using Word2Vec model

    ABDULLAH AMMAR KARCIOĞLU

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAtatürk Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ TOLGA AYDIN