Geri Dön

Sentiment analysis of twitter data on the Turkey earthquake using machine learning methods

Türkiye depremi üzere twitter verilerinin makine öğrenimi yöntemleri kullanilarak duygu analizi

  1. Tez No: 895514
  2. Yazar: ALA KAMAL RASHID
  3. Danışmanlar: PROF. DR. OĞUZ FINDIK
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: İngilizce
  9. Üniversite: Karabük Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 84

Özet

Sosyal medyanın gelişimi, insanların fikirlerini, duygularını ve deneyimlerini çeşitli yaratıcı dilsel ifadelerle iletme özgürlüğünü artırdı ve bu da kullanıcı tarafından üretilen verilerin önemli ölçüde artmasına yol açtı. Bu durum, insan duygularını ve ifadelerini incelemenin daha da önemli hale gelmesine neden oldu. Doğal dil işleme (NLP), yapay zekanın temel alanlarından biri olarak ortaya çıkmış ve insan dilinin anlaşılması ve yorumlanmasını sağlarken, kamu fikirlerini anlamak için hayati öneme sahip olan duygu analizi gibi yetenekler kazandırmıştır. NLP'deki önemli ilerlemelere rağmen, özellikle İngilizce gibi morfolojik olarak zengin dillerde, hala birçok zorlukla karşı karşıya kalmaktadır; burada geleneksel yaklaşımlar genellikle doğruluk ve hız konusunda sıkıntı yaşamaktadır. Sosyal medya metinleri genellikle argo, kısaltmalar ve birçok geleneksel duygu analizi yönteminin anlamadığı kültürel dil içerir. Aynı anda, büyük şirketlerin felaketler ve suç faaliyetleri sırasında kullanıcı verilerinin gözetimi ve korunmasıyla ilgili birçok etik endişe ortaya çıkmakta ve bu verilerin kamu yararına karşı sömürüye karşı korunması gerekliliği önem kazanmaktadır. Bu çalışma, 2023 Türkiye'de meydana gelen depremle ilgili olarak Twitter'a (X) odaklanıyor ve duygu analizi için alternatif bir yöntem sunuyor. Bir makine öğrenimi sınıflandırma yöntemi kullanarak, etkinlik sırasında ve sonrasında yapılan tweetleri inceledik; bu tweetler olumlu (örneğin, kontrol altına alma umutları), olumsuz (eşitsizlikle ilgili yorumlar gibi) veya doğal olarak etiketlendi. Bu çalışma, çeşitli makine öğrenimi modelleri arasında üç duygu etiketleme yönteminin (manuel etiketleme, VADER etiketleme ve küme etiketleme) etkinliğini karşılaştırmaktadır. Küme etiketlemesi sürekli olarak en yüksek doğruluğu elde ederken, otomatik duygu sınıflandırması için güvenilirliğini gösteriyor; VADER etiketlemesi ise tüm duygu kategorilerinde insan anotasyonlarıyla daha yakın bir uyum sergiliyor. (positive, negative, and neutral). Bu, VADER etiketlemesinin, biraz daha düşük doğruluğuna rağmen, insan duygusu yorumlamasının inceliklerini daha iyi yakaladığını öne sürüyor. İnsan onaylı manuel etiketlemenin zaman alıcı doğası ve gereken uzmanlık göz önüne alındığında, VADER, özellikle büyük ölçekli duygu analizi için pratik ve sezgisel bir alternatif olarak öne çıkıyor; burada NLTK_VADER gibi otomatik yöntemler daha maliyet etkin ve verimli olabilir.

Özet (Çeviri)

The development of social media has given people more freedom to communicate their ideas, feelings, and experiences through various creative linguistic expressions, leading to a significant increase in user-generated data, examining human emotions and expressions that are more important. Natural language processing (NLP) has emerged as a core area of artificial intelligence, enabling the understanding and interpretation of human language and sentiment analysis, which is crucial for comprehending public ideas. Despite significant advancements in NLP, it still faces numerous challenges, particularly in morphologically rich languages like English, where traditional approaches often struggle with accuracy and speed. Social media text often contains slang, abbreviations, and cultural lingo that many traditional sentiment analysis methods do not understand. Simultaneously, numerous ethical concerns arise regarding the surveillance and safeguarding of user data, particularly in times of calamities and criminal activities by large corporations, as well as their protection from exploitation against the public interest. This study focuses on the text-related 2023 Turkey earthquake on Twitter (X) and presents an alternative method for sentiment analysis. Using a machine learning classification method, we then examined tweets made both during the event and after, labeled by positive tweets (e.g., hopes of containment), negative ones (comments on inequity, for example), or natural ones. The study compares the effectiveness of three sentiment labeling methods (manual labeling, VADER labeling, and cluster labeling) across various machine learning models. While cluster labeling consistently achieves the highest accuracy, demonstrating its reliability for automated sentiment classification, VADER labeling shows a closer alignment with human annotations across all sentiment categories (positive, negative, and neutral). This suggests that VADER labeling better captures the nuances of human sentiment interpretation despite its slightly lower accuracy. Given the time-consuming nature and expertise required for human-validated manual labeling, VADER emerges as a practical and perceptive alternative, particularly for large-scale sentiment analysis, where automated methods like NLTK_VADER can be more cost-effective and efficient.

Benzer Tezler

  1. Suriyeli göçmenlere yönelik olumlu ve olumsuz tutumlarda medyanın rolü: Çerçeveleme ve yankı odası etkisi

    The role of media in positive and negative attitudes towards Syrian migrants: Framing and echo chamber effect

    SALİHA ÖZKANLI

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    PsikolojiAnkara Üniversitesi

    Psikoloji Ana Bilim Dalı

    PROF. DR. DERYA HASDAĞ

  2. Belediye hizmetlerinde memnuniyetin sosyal medya aracılığı ile değerlendirilmesi

    Evaluation of satisfaction in municipal services through social media

    FEYZA NUR UYAROĞLU AKDENİZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya Üniversitesi

    Yönetim Bilişim Sistemleri Ana Bilim Dalı

    DOÇ. DR. HALİL İBRAHİM CEBECİ

  3. Kuraklıkla ilgili sosyal medya mesajlarının duygu analizi

    Sentiment analysis of social media data about drought

    SEVDANUR DURAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSüleyman Demirel Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ TURGAY AYDOĞAN

  4. Türkiye de uygulanan COVID 19 aşılarının yan etkileri hakkında sosyal medya üzerinden toplumsal duygu analizi

    Communal sentiment analysis through social media on the side effects of COVID-19 vaccines applied in Turkey

    HATİCE GÜLCÜ

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Endüstri ve Endüstri MühendisliğiAtatürk Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ YEŞİM OK

  5. Halkla ilişkiler 2.0 kapsamında hedef belirleme ve ölçme sorunsalına bakış: Alternatif bir yöntem olarak veri madenciliğinin kullanılmasına yönelik örnek bir uygulama

    Overview of the goal setting and measurement problem under public relations 2.0: A samle application for using data as an alternative method

    HIDIR POLAT

    Doktora

    Türkçe

    Türkçe

    2021

    Halkla İlişkilerAtatürk Üniversitesi

    Halkla İlişkiler ve Tanıtım Ana Bilim Dalı

    PROF. DR. DERYA ÖCAL