Geri Dön

Kutupsallık sözlüğü ve yapay zeka yardımı ile Türkçe twitter verileri üzerinde duygu analizi

Sentiment analysis of Turkish twitter data using polarity lexicon and artificial intelligence

  1. Tez No: 536527
  2. Yazar: HARISU ABDULLAHI SHEHU
  3. Danışmanlar: PROF. DR. SEZAİ TOKAT
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2019
  8. Dil: Türkçe
  9. Üniversite: Pamukkale Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 85

Özet

Sosyal medya artık insanların duygularını etkilemede önemli bir rol oynamakta, insanların özellikle de tüketicilerin belirli bir konu, ürün veya fikir hakkında ne hissettiklerini analiz etmemize yardımcı olmaktadır. İnsanların düşüncelerini ifade etmek için kullandıkları güncel sosyal medya platformlarından biri Twitter'dır. Bu tez çalışmasında Twitter API'si kullanılarak Twitter'dan 13 bin tivit toplanmış ve kutupsallık sözlüğü ve makine öğrenmesi sınıflandırmaları yardımı ile duygu analizi yapılmıştır. Bu amaçla bu tez çalışmasında rasgele orman (random forest) ve destek vektör makineleri (support vector machines) olmak üzere iki farklı makine öğrenmesi yöntemi sınıflandırıcı olarak kullanılmıştır. Toplanan tivitler içeriğine göre pozitif, negatif veya nötr olarak etiketlenmiştir. Twitler üzerindeki duygu analizleri ham biçimdeki tivitler üzerinde, dizgecikler ve etkisiz-kelimeler (stop-words) çıkarıldıktan sonra oluşan veri üzerinde ve tivitlerin kökü bulunduktan sonra oluşan veri üzerinde olmak üzere üç farklı aşamada yapılmıştır. Bu aşamaların hepsinde ayrı ayrı duygu analizi yapılmıştır. Son olarak, kullanılan farklı yöntemler toplanan veriler üzerinde test edilmiştir. Ele alınan problem için destek vektör makinelerinin en kısa yürütme süresine sahip olduğu, rasgele orman yönteminin ham veriler üzerinde daha iyi performans gösterdiği, kutupsallık sözlüğü kullanan yöntemin performansının ise diğer yöntemlerde olmayan bir şekilde verilerin ham halinden köklerinin bulunduğu duruma doğru sürekli olarak iyileştiği gözlenmiştir

Özet (Çeviri)

Social media is now playing an important role in influencing people's sentiment and also helps us to analyze how people particularly consumers feel about a particular topic, a product or an idea. One of the recent social media platforms to express thoughts is Twitter. In this thesis, a sum of 13K Turkish tweets had been collected from Twitter using the Twitter API and their sentiments are being analyzed using polarity lexicon and the use of machine learning classifiers. Random forests and support vector machines are the two kinds of classifiers that are adopted. The collected tweets are classified to be either positive, negative or neutral based on their contents and then their sentiments have been analyzed in three different phases both when the tweets are in raw form, after the tweets are converted into tokens and stop-words are being removed from them and also when the tweets are being stemmed. Finally, the different methodologies used have been tested and find out that support vector machines is the method with the shortest execution time, while random forests perform better on raw data before any manipulation of the data, the performance of the method using polarity lexicon increases continuously as the data being manipulated from raw up to stemmed data.

Benzer Tezler

  1. Osmanlı tarih deyimleri ve terimleri sözlüğü'ndeki askerî terimler

    Military terms in the Ottoman historic idioms and terms dictionary

    FERDİ BÜLBÜL

    Yüksek Lisans

    Türkçe

    Türkçe

    2011

    Türk Dili ve EdebiyatıBozok Üniversitesi

    Türk Edebiyatı Bölümü

    YRD. DOÇ. DR. SEYFULLAH TÜRKMEN

  2. İktidar stratejileri ve ölüm: Toplumsalın kuruluşu

    Strategies of power and death: Construction of the social

    HÜSEYİN KIRMIZI

    Doktora

    Türkçe

    Türkçe

    2021

    SosyolojiAnkara Üniversitesi

    Sosyoloji Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ KURTULUŞ CENGİZ

  3. Türkiye Türkçesi ve Kazak Türkçesindeki bitki adlarının yapı ve anlam bakımından karşılaştırılması

    Comparison of plant names in Kazakh Turkish and Turkey Turkish in terms of structure and meaning

    AYŞEGÜL ŞAHİN

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    DilbilimGaziantep Üniversitesi

    Türk Dili ve Edebiyatı Ana Bilim Dalı

    PROF. DR. HÜLYA ARSLAN EROL

  4. Müşteri memnuniyetinin kalite boyutları bakımından metin madenciliği ile keşfi

    Discovery of customer satisfaction through text mining in terms of quality dimensions

    METİN ERGÖKTAŞ

    Doktora

    Türkçe

    Türkçe

    2024

    İşletmeErciyes Üniversitesi

    İşletme Ana Bilim Dalı

    PROF. DR. MEHMET SITKI İLKAY

  5. Kutsal kentleri tanımlama ve belirlemede yöntemsel bir yaklaşım

    A methodic approach for defining and determining sacred cities

    AYŞE NUR CANBOLAT

    Doktora

    Türkçe

    Türkçe

    2022

    Şehircilik ve Bölge PlanlamaGazi Üniversitesi

    Şehir ve Bölge Planlama Ana Bilim Dalı

    PROF. DR. NEVİN GÜLTEKİN