Sentiment analysis of twitter texts using machine learning algorithms
Makine öğrenme algoritmaları kullanılan twitter metinlerinin duygu analizi
- Tez No: 682241
- Danışmanlar: DR. ÖĞR. ÜYESİ VEYSEL HARUN ŞAHİN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2021
- Dil: İngilizce
- Üniversite: Sakarya Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar ve Bilişim Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 78
Özet
Bu tezde, veri seti şeklinde kaydedilen Trump'ın tweet'leri kazınmış web sayfası üzerinde doğal dil işleme ve makine öğrenmesi sınıflandırıcılarının kullanımı olarak duygu analizi incelenmiştir. Veri hazırlandıktan sonra, ana bilgisayar veri setine en önemli duygu analizi prosedürleri uygulanmıştır. Ayrıca, metin vektörleştirmeye hazır olmak için veri kümesini temizlemek gibi diğer doğal dil işleme stratejileri de işlenmiştir. Metinsel verilerin temizlenmesinde, istenmeyen kelimelerin kaldırılması için stopwords kaldırma, kelime lemmatization, düzenli ifade ve tokenization gibi gerekli tüm teknikler kullanılmıştır. Daha az kapasite alma hedefi ile veri setindeki“içerik”özelliğinin boyutunu küçültmeyi başardık. Son yirmi yılda sosyal medya ağlarının gelişmesiyle birlikte nefret dolu faaliyetler bir fenomen haline geldi, bu, her birinin yayınlanan metninin öznel kutuplarını bilmek zorlu bir görev haline geldi; bu nedenle, her cümle, olumlu, olumsuz veya tarafsız olup olmadığı kutuplarına göre yargılanmıştır. Sonunda (Random Forest sınıflandırıcı, Gaussian Naive Bayes ve Support Vector Machine) gibi makine öğrenme algoritmaları kullanılarak temizlenen veriler eğitilmiş ve tahmin sonuçlarının doğruluğunu görmek için test edilmiştir, 88%, 72% ve her sınıflandırıcı için sırasıyla 89%.
Özet (Çeviri)
In this thesis, sentiment analysis as the use of natural language processing and machine learning classifiers have been studied on Trump's tweets scraped web page, which is saved in the form of dataset. After data preparation, the most important sentiment analysis procedures have been applied to the host dataset. Also, other natural language processing strategies have been processed, like cleaning the dataset in order to be ready for text vectorization. In cleaning the textual data, all the required techniques like removing stopwords, word lemmatization, regular expression, and tokenization have been used to remove undesired words. We succeeded in reducing the size of the“content”feature in the dataset with the target of taking fewer capacity. Since the two last decades with the development of social media networks, hateful activities have become a phenomenon, this became a challenging task to know the subjective polarities of each one's published text; therefore, each sentence has been judged-on regarding their polarities whether they are positive, negative or neutral. At the end, by using machine learning algorithms like (Random Forest classifier, Gaussian Naive Bayes, and Support Vector Machine), the cleaned data has been trained and tested to see the accuracy of the prediction results, the comparison shows 88%, 72%, and 89% respectively for each classifier.
Benzer Tezler
- Makine öğrenmesi yöntemleri kullanılarak uzaktan eğitim konulu Türkçe tweetlerin duygu analizi
Turkish tweets on distance education using machine learning methods sentiment analysis
ALİ CAN AKDENİZ
Yüksek Lisans
Türkçe
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKonya Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. İSMAİL BABAOĞLU
- Türkçe metinlerde duygu analizi
Sentiment analysis in Turkish texts
CUMALİ TÜRKMENOĞLU
Yüksek Lisans
Türkçe
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. AHMET CÜNEYD TANTUĞ
- Portfolio optimization with sentiment analysis
Yaklaşım analizi ile portföy optimizasyonu
AHMET ERARSLAN
Yüksek Lisans
İngilizce
2024
Endüstri ve Endüstri MühendisliğiBoğaziçi ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
PROF. DR. AHMET REFİK GÜLLÜ
- Sentiment analysis in data of twitter using machine learning algorithms
HESSDS analizlerinin twitter verilerinde Keullehiler makensi algoritme lerenin òğrenimi
MUSTAFA AHMED MAHMOOD
Yüksek Lisans
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAltınbaş ÜniversitesiBilişim Teknolojileri Ana Bilim Dalı
DR. ÖĞR. ÜYESİ SEFER KURNAZ
- İngilizce ve Türkçe twitter mesajlarının Word2Vec modeli ile sınıflandırılması
Classification of English and Turkish twitter messages by using Word2Vec model
ABDULLAH AMMAR KARCIOĞLU
Yüksek Lisans
Türkçe
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAtatürk ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ TOLGA AYDIN