Sentiment analysis of twitter data on the Turkey earthquake using machine learning methods
Türkiye depremi üzere twitter verilerinin makine öğrenimi yöntemleri kullanilarak duygu analizi
- Tez No: 895514
- Danışmanlar: PROF. DR. OĞUZ FINDIK
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: İngilizce
- Üniversite: Karabük Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
- Sayfa Sayısı: 84
Özet
Sosyal medyanın gelişimi, insanların fikirlerini, duygularını ve deneyimlerini çeşitli yaratıcı dilsel ifadelerle iletme özgürlüğünü artırdı ve bu da kullanıcı tarafından üretilen verilerin önemli ölçüde artmasına yol açtı. Bu durum, insan duygularını ve ifadelerini incelemenin daha da önemli hale gelmesine neden oldu. Doğal dil işleme (NLP), yapay zekanın temel alanlarından biri olarak ortaya çıkmış ve insan dilinin anlaşılması ve yorumlanmasını sağlarken, kamu fikirlerini anlamak için hayati öneme sahip olan duygu analizi gibi yetenekler kazandırmıştır. NLP'deki önemli ilerlemelere rağmen, özellikle İngilizce gibi morfolojik olarak zengin dillerde, hala birçok zorlukla karşı karşıya kalmaktadır; burada geleneksel yaklaşımlar genellikle doğruluk ve hız konusunda sıkıntı yaşamaktadır. Sosyal medya metinleri genellikle argo, kısaltmalar ve birçok geleneksel duygu analizi yönteminin anlamadığı kültürel dil içerir. Aynı anda, büyük şirketlerin felaketler ve suç faaliyetleri sırasında kullanıcı verilerinin gözetimi ve korunmasıyla ilgili birçok etik endişe ortaya çıkmakta ve bu verilerin kamu yararına karşı sömürüye karşı korunması gerekliliği önem kazanmaktadır. Bu çalışma, 2023 Türkiye'de meydana gelen depremle ilgili olarak Twitter'a (X) odaklanıyor ve duygu analizi için alternatif bir yöntem sunuyor. Bir makine öğrenimi sınıflandırma yöntemi kullanarak, etkinlik sırasında ve sonrasında yapılan tweetleri inceledik; bu tweetler olumlu (örneğin, kontrol altına alma umutları), olumsuz (eşitsizlikle ilgili yorumlar gibi) veya doğal olarak etiketlendi. Bu çalışma, çeşitli makine öğrenimi modelleri arasında üç duygu etiketleme yönteminin (manuel etiketleme, VADER etiketleme ve küme etiketleme) etkinliğini karşılaştırmaktadır. Küme etiketlemesi sürekli olarak en yüksek doğruluğu elde ederken, otomatik duygu sınıflandırması için güvenilirliğini gösteriyor; VADER etiketlemesi ise tüm duygu kategorilerinde insan anotasyonlarıyla daha yakın bir uyum sergiliyor. (positive, negative, and neutral). Bu, VADER etiketlemesinin, biraz daha düşük doğruluğuna rağmen, insan duygusu yorumlamasının inceliklerini daha iyi yakaladığını öne sürüyor. İnsan onaylı manuel etiketlemenin zaman alıcı doğası ve gereken uzmanlık göz önüne alındığında, VADER, özellikle büyük ölçekli duygu analizi için pratik ve sezgisel bir alternatif olarak öne çıkıyor; burada NLTK_VADER gibi otomatik yöntemler daha maliyet etkin ve verimli olabilir.
Özet (Çeviri)
The development of social media has given people more freedom to communicate their ideas, feelings, and experiences through various creative linguistic expressions, leading to a significant increase in user-generated data, examining human emotions and expressions that are more important. Natural language processing (NLP) has emerged as a core area of artificial intelligence, enabling the understanding and interpretation of human language and sentiment analysis, which is crucial for comprehending public ideas. Despite significant advancements in NLP, it still faces numerous challenges, particularly in morphologically rich languages like English, where traditional approaches often struggle with accuracy and speed. Social media text often contains slang, abbreviations, and cultural lingo that many traditional sentiment analysis methods do not understand. Simultaneously, numerous ethical concerns arise regarding the surveillance and safeguarding of user data, particularly in times of calamities and criminal activities by large corporations, as well as their protection from exploitation against the public interest. This study focuses on the text-related 2023 Turkey earthquake on Twitter (X) and presents an alternative method for sentiment analysis. Using a machine learning classification method, we then examined tweets made both during the event and after, labeled by positive tweets (e.g., hopes of containment), negative ones (comments on inequity, for example), or natural ones. The study compares the effectiveness of three sentiment labeling methods (manual labeling, VADER labeling, and cluster labeling) across various machine learning models. While cluster labeling consistently achieves the highest accuracy, demonstrating its reliability for automated sentiment classification, VADER labeling shows a closer alignment with human annotations across all sentiment categories (positive, negative, and neutral). This suggests that VADER labeling better captures the nuances of human sentiment interpretation despite its slightly lower accuracy. Given the time-consuming nature and expertise required for human-validated manual labeling, VADER emerges as a practical and perceptive alternative, particularly for large-scale sentiment analysis, where automated methods like NLTK_VADER can be more cost-effective and efficient.
Benzer Tezler
- Suriyeli göçmenlere yönelik olumlu ve olumsuz tutumlarda medyanın rolü: Çerçeveleme ve yankı odası etkisi
The role of media in positive and negative attitudes towards Syrian migrants: Framing and echo chamber effect
SALİHA ÖZKANLI
- Belediye hizmetlerinde memnuniyetin sosyal medya aracılığı ile değerlendirilmesi
Evaluation of satisfaction in municipal services through social media
FEYZA NUR UYAROĞLU AKDENİZ
Yüksek Lisans
Türkçe
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya ÜniversitesiYönetim Bilişim Sistemleri Ana Bilim Dalı
DOÇ. DR. HALİL İBRAHİM CEBECİ
- Kuraklıkla ilgili sosyal medya mesajlarının duygu analizi
Sentiment analysis of social media data about drought
SEVDANUR DURAN
Yüksek Lisans
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSüleyman Demirel ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ TURGAY AYDOĞAN
- Türkiye de uygulanan COVID 19 aşılarının yan etkileri hakkında sosyal medya üzerinden toplumsal duygu analizi
Communal sentiment analysis through social media on the side effects of COVID-19 vaccines applied in Turkey
HATİCE GÜLCÜ
Yüksek Lisans
Türkçe
2023
Endüstri ve Endüstri MühendisliğiAtatürk ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ YEŞİM OK
- Halkla ilişkiler 2.0 kapsamında hedef belirleme ve ölçme sorunsalına bakış: Alternatif bir yöntem olarak veri madenciliğinin kullanılmasına yönelik örnek bir uygulama
Overview of the goal setting and measurement problem under public relations 2.0: A samle application for using data as an alternative method
HIDIR POLAT
Doktora
Türkçe
2021
Halkla İlişkilerAtatürk ÜniversitesiHalkla İlişkiler ve Tanıtım Ana Bilim Dalı
PROF. DR. DERYA ÖCAL