Geri Dön

Sosyal medya izleme ve deprem acil durumlarına hızlı yanıt: Twitter verisi üzerine bir çalışma

Social media monitoring and rapid response to earthquake emergencies: A study on twitter data

  1. Tez No: 843546
  2. Yazar: DİLARA CANDAN
  3. Danışmanlar: DR. ÖĞR. ÜYESİ GÜLŞAH TÜMÜKLÜ ÖZYER
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: Türkçe
  9. Üniversite: Atatürk Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 72

Özet

Amaç: Deprem, ülkemizin karşı karşıya olduğu en kaçınılmaz doğal afetlerden biridir. Tarihsel süreçte pek çok kez büyük kayıplara yol açan bu doğal olayın getirdiği tehlikelerin yönetilmesi, toplumun can ve mal güvenliği için son derece kritiktir. Depremin hemen ardından alınması gereken hızlı aksiyonlar için anlık ve doğru veriye erişim büyük önem taşımaktadır. Ancak, bu kritik dönemde toplanan veri genellikle yoğun ve karmaşıktır, bu nedenle sadece sınırlı miktarda veri etiketlemesi mümkündür. Bu tez çalışmasının öncelikli amacı, böyle bir durumda Twitter'da meydana gelen veri kirliliği içerisinden, afet yönetimi ve müdahale için kritik öneme sahip bilgileri hızlı ve etkin bir şekilde sınıflandırabilmektir. Bu sürecin en önemli zorluğu, az sayıda etiketli veri ile maksimum verimliliğe ulaşmayı hedeflemektir. Bu bağlamda, tez çalışmasında BERT, RoBERTa ve DistilBERT modellerinin yanı sıra, geleneksel makine öğrenmesi yöntemleri ve sıfır atış (zero-shot) ile birkaç örnek öğrenme (few-shot) yöntemleri incelenmiş, ek olarak TARS modeli ele alınarak deprem sonrası sosyal medya verisinin sınıflandırılmasında bu modellerin etkinliğini değerlendirmeyi amaçlamaktadır. Yöntem: Bu çalışmada Türkçe Twitter verileri ile metin sınıflandırma amacıyla ülkemizde en son meydana gelen ve çok büyük yıkımlara sebep olan 6 Şubat 2023 depremine ait tweetler üzerinde çalışılmıştır. Bu depreme ait hali hazırda derlenmiş bir tweet veri seti araştırılarak bulunmuştur (Kaggle Turkey and Syria Earthquake Tweets). Bu veri setinden 2000 tane veri seçilerek 3 sınıf olacak şekilde etiketleme yapılmıştır. Bu sınıflar ilgisiz (0), enkaz (1) ve ihtiyaç (2) şeklindedir. Elde bulunan az sayıda etiketli veri ile transfer öğrenme yöntemlerinden olan BERT, RoBERTa ve DistilBERT kullanılarak eğitimler yapılmıştır. Bu modeller ile sınırlı kalmayıp geleneksel yöntemler ile de değerlendirilerek kıyaslama yapılmıştır. Tüm bunlara ek olarak daha az veri ile de çalışmalar yapılarak sıfır atış (zero-shot) ile birkaç örnek öğrenme (few-shot) yöntemleri de çalışmaya dahil edilmiştir. Bu eğitimlerde alınan sonuçlara göre en başarılı sonuçları veren model belirlenmiştir. Bulgular: Çalışma kapsamında az sayıda etiketli veri ile başarılı sonuçları elde etmek hedeflenmiştir. Alınan sonuçlar detaylı olarak incelendiğinde kullanılan modellerin beklendiği gibi sonuçlar verdiği gözlemlenmiştir. Sonuçlara göre hazırlanan veri setinin tamamını kullanmadan bile çok az bir kısmını kullanarak da benzer sonuçlar elde edilmiştir. Sonuç: Bu çalışma kapsamında bir afet sonrasında sosyal medyadan gelen verileri sınıflandırarak anlamlı hale getirebilmek hedeflenmişti. Sonuç olarak seçilen yöntemler ile yapılan çalışmaların sonucunda bu amaca uygun olduğu gözlemlenmiştir.

Özet (Çeviri)

Purpose: Earthquakes are among the most inevitable natural disasters faced by our country. Managing the risks brought by this natural phenomenon, which has historically caused great losses many times, is critically important for the safety of life and property in society. Access to instant and accurate data for swift actions required immediately after an earthquake is of great importance. However, during this critical period, the data collected is often voluminous and complex, thus only a limited amount of data labeling is possible. The primary objective of this thesis is to classify, quickly and effectively, the information of critical importance for disaster management and response from the data pollution on Twitter in such a situation. The main challenge of this process is to achieve maximum efficiency with a small amount of labeled data. In this context, the thesis examines BERT, RoBERTa, and DistilBERT models, as well as traditional machine learning methods and zero-shot with few-shot learning approaches, and aims to evaluate the effectiveness of these models in classifying social media data after earthquakes. Method: In this study, Turkish Twitter data related to the most recent devastating earthquake that struck our country on February 6, 2023, has been analyzed for text classification purposes. A dataset of tweets regarding this earthquake has been compiled and located (Kaggle Turkey and Syria Earthquake Tweets). From this dataset, 2000 data points have been selected and labeled into 3 classes: irrelevant (0), debris (1), and needs (2). Training has been conducted using transfer learning methods such as BERT, RoBERTa, and DistilBERT with this limited labeled data. Not confined to these models, traditional methods have also been evaluated for comparison. Additionally, less data-intensive approaches such as zero-shot and few-shot learning methods have been incorporated into the study. Based on the results of these trainings, the most successful model has been determined. Findings: The study aimed to achieve successful results with a limited number of labeled data. Upon detailed examination of the outcomes, it was observed that the models performed as expected. The results indicated that similar outcomes were obtained even without using the entire prepared dataset, but by utilizing only a small portion of it. Conclusion: The objective of this study was to classify data from social media after a disaster, making it meaningful. As a result, it has been observed that the methods chosen for the studies conducted are suitable for this purpose.

Benzer Tezler

  1. Social media data valuation model for disaster incidence mapping

    Sosyal medya verilerinin afet olaylarının haritalanması için değerlendirme modeli

    AYŞE GİZ GÜLNERMAN GENGEÇ

    Doktora

    İngilizce

    İngilizce

    2020

    Jeodezi ve Fotogrametriİstanbul Teknik Üniversitesi

    Geomatik Mühendisliği Ana Bilim Dalı

    PROF. DR. HİMMET KARAMAN

  2. Machine learning of social media data on a spatio-temporal basis

    Sosyal medya verilerinin zaman-mekansal temellere göre makine öğrenimi

    BÜŞRA YEŞİLBAŞ

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGalatasaray Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. TANKUT ACARMAN

  3. Makine öğrenmesi yöntemleri ile sahte felaket tweetlerinin tahmini

    Predicting fake disaster tweets with machine learning methods

    FATMA KURŞUN

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    İstatistikYıldız Teknik Üniversitesi

    İstatistik Ana Bilim Dalı

    PROF. DR. FATMA NOYAN TEKELİ

  4. Understanding twitter users' behaviour by social network analysis during disasters

    Afet durumunda twıtter kullanıcılarının sosyal ağ analizi ile davranışını anlama

    GÖZDE MERVE DEMİRCİ

    Yüksek Lisans

    İngilizce

    İngilizce

    2020

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    PROF. DR. ŞULE ITIR SATOĞLU

    DOÇ. DR. GÜLÜSTAN DOĞAN

  5. A video dataset of incidents & video-based incident classification

    Felaket video veriseti & video-tabanlı felaket sınıflandırması

    DUYGU SESVER

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. HAZIM KEMAL EKENEL