Geri Dön

Sosyal medyadaki Türkçe sahte haberlerin derin öğrenme yaklaşımıyla tespiti ve sınıflandırılması

Detection and classification of fake news in Turkish on social media using a deep learning approach

  1. Tez No: 849120
  2. Yazar: GÜLSÜM KAYABAŞI KORU
  3. Danışmanlar: PROF. DR. ÇELEBİ ULUYOL
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: Türkçe
  9. Üniversite: Gazi Üniversitesi
  10. Enstitü: Bilişim Enstitüsü
  11. Ana Bilim Dalı: Adli Bilişim Ana Bilim Dalı
  12. Bilim Dalı: Adli Bilişim Bilim Dalı
  13. Sayfa Sayısı: 150

Özet

Sosyal ağları kullanan kişi sayısının artmasıyla daha fazla kişinin haber ihtiyacını karşılamak maksadıyla sosyal medya platformları kullanılmaktadır. Kullanıcılar gazete haber sayfaları yerine özellikle Twitter üzerinden haberlere ulaşarak gündemi takip etmenin daha kolay olduğunu düşünmektedir. Ancak sahte haberler sosyal medyada giderek daha fazla yer almakta ve insanların kısmi haber sayfalarından ya da kısa Twitter paylaşımlarından doğru haberlere ulaşabilmesi her zaman mümkün olmamaktadır. Twitter'da paylaşılan haberlerin doğru olup olmadığının anlaşılması önemli bir problemdir. Sahte tivitlerin tespit edilmesi her dilde olduğu gibi Türkçe'de de büyük önem taşımaktadır. Bu çalışmada, Twitter'daki doğrulama platformlarından elde edilen sahte haberler ve ana akım gazetelerin Twitter hesaplarından elde edilen gerçek haberler etiketlenerek, Türkçe için geliştirilen Zemberek doğal dil işleme aracı kullanılarak ön işleme tabi tutulmuş ve TR_FaRe_News isimli bir veri kümesi oluşturulmuştur. Ardından, TR_FaRe_News veri kümesi, sahte haber tespiti için topluluk yöntemleri ve BoW, TF-IDF ve Word2Vec vektörleştirme yöntemleri kullanılarak araştırılmıştır. Ayrıca, fastText ile kelime yerleştirme işlemi yapılarak fastText dil modelimiz içerisinde bulunan sk-learn kütüphaneleri kullanılarak haberlerin sınıflandırma başarısı farklı parametreler ile analiz edilmiştir. Ardından, önceden eğitilmiş bir BERT derin öğrenme modeline ince ayar yapılmış ve Bi-LSTM ve Evrişimsel Sinir Ağı katmanları ile genişletilen modelin dondurulmuş ve dondurulmamış parametreler yöntemleriyle varyasyonları araştırılmıştır. Performans değerlendirmesi BuzzFeedNews, GossipCop, ISOT, LIAR, Twitter15, Twitter16 ve LLM tarafından üretilen bir sahte haber veri kümesi olmak üzere yedi karşılaştırılabilir veri kümesi kullanılarak gerçekleştirilmiştir. Türkçe tweetlerin analiz edilmesi ve LLM tarafından üretilen sahte haber veri kümlerinin kullanılması önemli bir katkı olarak değerlendirilmektedir. BERT modelleriyle %90 ile %94 arasında, BERTurk+CNN modeliyle %94 oranında doğruluk elde edilmiştir.

Özet (Çeviri)

With the increasing number of people using social networks, social media platforms are being leveraged to address the news demands of more people. Users prefer accessing news on Twitter rather than traditional newspaper websites as it allows for a more streamlined and convenient way to follow the agenda. However, fake news is rapidly emerging on social media, and it is not always viable for individuals to acquire genuine news from fragmentary news pages or short Twitter tweets. Determining the veracity of news disseminated on Twitter is a crucial issue. Identifying fake tweets is crucial not only in Turkish but also in any other language. In this work, fake news received via verification services on Twitter and true news obtained from Twitter accounts of mainstream publications are tagged and preprocessed using the Zemberek natural language processing tool built for Turkish, and a dataset entitled TR_FaRe_News is constructed. Next, the TR_FaRe_News dataset is examined to identify false news using ensemble techniques and vectorization methods such as Bag-of-Words (BoW), Term Frequency-Inverse Document Frequency (TF-IDF), and Word2Vec. In addition, word embedding is conducted with fastText, and the classification effectiveness of the news is analyzed with different parameters using sk-learn libraries in our fastText language model. Subsequently, a pre-trained BERT deep learning model was further refined and expanded upon. The study examined the utilization of Bi-LSTM and Convolutional Neural Network layers, along with their different modifications, using both frozen and unfrozen parameter approaches. The performance evaluation is conducted using seven datasets that are comparable: BuzzFeedNews, GossipCop, ISOT, LIAR, Twitter15, Twitter16, and a synthetic fake news dataset created by LLM. Analyzing Turkish tweets and using fake news datasets created by LLM is considered a noteworthy contribution. The BERT models had accuracies ranging from 90% to 94%, while the BERTurk+CNN model achieved an accuracy of 94%.

Benzer Tezler

  1. Derin öğrenme algoritmaları ile Türkçe dilinde sahte haber tespiti

    Detecting fake news in Turkish with deep learning algorithms

    SÜLEYMAN GÖKHAN TAŞKIN

    Doktora

    Türkçe

    Türkçe

    2020

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSüleyman Demirel Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. ECİR UĞUR KÜÇÜKSİLLE

    DR. ÖĞR. ÜYESİ KAMİL TOPAL

  2. Sürü zekâsı tabanlı yöntemler kullanılarak çevrimiçi sosyal ağlarda sahte haber tespiti

    Fake news detection in online social networks using swarm intelligence based methods

    FEYZA ALTUNBEY ÖZBAY

    Doktora

    Türkçe

    Türkçe

    2020

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat Üniversitesi

    Yazılım Mühendisliği Ana Bilim Dalı

    PROF. DR. BİLAL ALATAŞ

  3. Hakikat sonrası bir dönemde sahte haber: İsrail-Filistin çatışması üzerine bir çözümleme

    Fake news in a post-true era: An analysis of the Israel-Palestine conflict

    HATİCE KAYNAK

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    İletişim BilimleriAksaray Üniversitesi

    İletişim Bilimleri Ana Bilim Dalı

    DOÇ. DR. ZÜHAL FİDAN BARİTCİ

  4. Değişen tüketim toplumu bağlamında Z kuşağının enformasyon ve dezenformasyon algısı: Sosyal medya haber tüketim davranışına yönelik bir araştırma

    Information and disinformation perception of generation Z in the context of the changing consumer society: A Research on social media news consumption behavior

    ÖMER FARUK NAZLIM

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Halkla İlişkilerAnkara Hacı Bayram Veli Üniversitesi

    Halkla İlişkiler ve Tanıtım Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ NARGİS ÖZGEN

  5. Understanding twitter users' behaviour by social network analysis during disasters

    Afet durumunda twıtter kullanıcılarının sosyal ağ analizi ile davranışını anlama

    GÖZDE MERVE DEMİRCİ

    Yüksek Lisans

    İngilizce

    İngilizce

    2020

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    PROF. DR. ŞULE ITIR SATOĞLU

    DOÇ. DR. GÜLÜSTAN DOĞAN