Kutupsallık sözlüğü ve yapay zeka yardımı ile Türkçe twitter verileri üzerinde duygu analizi
Sentiment analysis of Turkish twitter data using polarity lexicon and artificial intelligence
- Tez No: 536527
- Danışmanlar: PROF. DR. SEZAİ TOKAT
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2019
- Dil: Türkçe
- Üniversite: Pamukkale Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 85
Özet
Sosyal medya artık insanların duygularını etkilemede önemli bir rol oynamakta, insanların özellikle de tüketicilerin belirli bir konu, ürün veya fikir hakkında ne hissettiklerini analiz etmemize yardımcı olmaktadır. İnsanların düşüncelerini ifade etmek için kullandıkları güncel sosyal medya platformlarından biri Twitter'dır. Bu tez çalışmasında Twitter API'si kullanılarak Twitter'dan 13 bin tivit toplanmış ve kutupsallık sözlüğü ve makine öğrenmesi sınıflandırmaları yardımı ile duygu analizi yapılmıştır. Bu amaçla bu tez çalışmasında rasgele orman (random forest) ve destek vektör makineleri (support vector machines) olmak üzere iki farklı makine öğrenmesi yöntemi sınıflandırıcı olarak kullanılmıştır. Toplanan tivitler içeriğine göre pozitif, negatif veya nötr olarak etiketlenmiştir. Twitler üzerindeki duygu analizleri ham biçimdeki tivitler üzerinde, dizgecikler ve etkisiz-kelimeler (stop-words) çıkarıldıktan sonra oluşan veri üzerinde ve tivitlerin kökü bulunduktan sonra oluşan veri üzerinde olmak üzere üç farklı aşamada yapılmıştır. Bu aşamaların hepsinde ayrı ayrı duygu analizi yapılmıştır. Son olarak, kullanılan farklı yöntemler toplanan veriler üzerinde test edilmiştir. Ele alınan problem için destek vektör makinelerinin en kısa yürütme süresine sahip olduğu, rasgele orman yönteminin ham veriler üzerinde daha iyi performans gösterdiği, kutupsallık sözlüğü kullanan yöntemin performansının ise diğer yöntemlerde olmayan bir şekilde verilerin ham halinden köklerinin bulunduğu duruma doğru sürekli olarak iyileştiği gözlenmiştir
Özet (Çeviri)
Social media is now playing an important role in influencing people's sentiment and also helps us to analyze how people particularly consumers feel about a particular topic, a product or an idea. One of the recent social media platforms to express thoughts is Twitter. In this thesis, a sum of 13K Turkish tweets had been collected from Twitter using the Twitter API and their sentiments are being analyzed using polarity lexicon and the use of machine learning classifiers. Random forests and support vector machines are the two kinds of classifiers that are adopted. The collected tweets are classified to be either positive, negative or neutral based on their contents and then their sentiments have been analyzed in three different phases both when the tweets are in raw form, after the tweets are converted into tokens and stop-words are being removed from them and also when the tweets are being stemmed. Finally, the different methodologies used have been tested and find out that support vector machines is the method with the shortest execution time, while random forests perform better on raw data before any manipulation of the data, the performance of the method using polarity lexicon increases continuously as the data being manipulated from raw up to stemmed data.
Benzer Tezler
- Osmanlı tarih deyimleri ve terimleri sözlüğü'ndeki askerî terimler
Military terms in the Ottoman historic idioms and terms dictionary
FERDİ BÜLBÜL
Yüksek Lisans
Türkçe
2011
Türk Dili ve EdebiyatıBozok ÜniversitesiTürk Edebiyatı Bölümü
YRD. DOÇ. DR. SEYFULLAH TÜRKMEN
- İktidar stratejileri ve ölüm: Toplumsalın kuruluşu
Strategies of power and death: Construction of the social
HÜSEYİN KIRMIZI
- Türkiye Türkçesi ve Kazak Türkçesindeki bitki adlarının yapı ve anlam bakımından karşılaştırılması
Comparison of plant names in Kazakh Turkish and Turkey Turkish in terms of structure and meaning
AYŞEGÜL ŞAHİN
Yüksek Lisans
Türkçe
2018
DilbilimGaziantep ÜniversitesiTürk Dili ve Edebiyatı Ana Bilim Dalı
PROF. DR. HÜLYA ARSLAN EROL
- Müşteri memnuniyetinin kalite boyutları bakımından metin madenciliği ile keşfi
Discovery of customer satisfaction through text mining in terms of quality dimensions
METİN ERGÖKTAŞ
- Kutsal kentleri tanımlama ve belirlemede yöntemsel bir yaklaşım
A methodic approach for defining and determining sacred cities
AYŞE NUR CANBOLAT
Doktora
Türkçe
2022
Şehircilik ve Bölge PlanlamaGazi ÜniversitesiŞehir ve Bölge Planlama Ana Bilim Dalı
PROF. DR. NEVİN GÜLTEKİN