Geri Dön

Doğal dil işleme kullanılarak ana akım medyada Türkçe sahte haber tespiti

Turkish fake news detection on mainstream media using natural language processing

  1. Tez No: 921692
  2. Yazar: İSA KULAKSIZ
  3. Danışmanlar: DR. ÖĞR. ÜYESİ AHMET COŞKUNÇAY
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2025
  8. Dil: Türkçe
  9. Üniversite: Atatürk Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 69

Özet

Amaç: Bu araştırma, sahte haberlerin ana akım medyada tespiti için bir dilbilimsel model geliştirmeyi hedeflemektedir. Sınıflandırma algoritmaları üzerinde çalışılmış ve kelime temsil yöntemlerinin, sınıflandırma sonuçları üzerindeki etkisi incelenmiştir. Özellikle, bu çalışma uzman tabanlı manuel kontrol yöntemlerine olan ihtiyacı azaltarak bir haberin gerçeklik durumunu belirlemede kolaylık sağlamıştır. Yöntem: Bu çalışmada, çeşitli haber sitelerinden toplanan haberler sahte (0) ve gerçek (1) olarak etiketlenmiştir. En başarılı modeli belirlemek için makine öğrenimi, LSTM ve BERTurk algoritmalarıyla eğitimler gerçekleştirilmiştir. Ayrıca, n-gram ve kelime çantası yöntemleri kullanılarak özellik çıkarımı yapılmıştır. Bulgular: Bulgular, BERTurk modelinin %98,21 doğrulukla diğer sınıflandırma algoritmalarına göre daha iyi performans gösterdiğini ve makine öğrenimi algoritmalarında ise TF-IDF'nin CountVectorizer ve Word2Vec'e göre daha etkili bir kelime temsil yöntemi olduğunu ortaya koymuştur. Sonuçlar: Bu araştırma, ana akım medyadan toplanan haberlerin gerçekliğini ayırt etmek için bir sınıflandırma yapmıştır. Sonuç olarak, kullanılan algoritmaların ve yöntemlerin bu konuda etkili olduğu görülmüştür.

Özet (Çeviri)

Purpose: The aim of this research is to develop a linguistic model for the detection of fake news in mainstream media. Classification algorithms have been investigated and the impact of word representation methods on classification results has been investigated. In particular, this study has facilitated determining the accuracy of news by reducing the need for expert-based manual control methods. Method: In this study, news articles collected from various news sites were labeled as fake (0) and real (1). To determine the most successful model, training was conducted using machine learning, LSTM and BERTurk algorithms. In addition, feature extraction was performed using n-gram and bag-of-words methods. Findings: The findings revealed that the BERTurk model performs better than other classification algorithms, with 98.21% accuracy, and that TF-IDF is more effective word representation method than CountVectorizer and Word2Vec in machine learning algorithms. Conclusions: This research has classified news collected from mainstream media to distinguish of their accuracy. As a result, it has been observed that the algorithms and methods used are effective in this regard.

Benzer Tezler

  1. Sosyal medyadaki Türkçe sahte haberlerin derin öğrenme yaklaşımıyla tespiti ve sınıflandırılması

    Detection and classification of fake news in Turkish on social media using a deep learning approach

    GÜLSÜM KAYABAŞI KORU

    Doktora

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Adli Bilişim Ana Bilim Dalı

    PROF. DR. ÇELEBİ ULUYOL

  2. Türkçe için sahte haber tespit modelinin oluşturulması

    A fake news detection model for Turkish language

    UĞUR MERTOĞLU

    Doktora

    Türkçe

    Türkçe

    2020

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ BURKAY GENÇ

    PROF. DR. HAYRİ SEVER

  3. Developing a Turkish sentiment lexicon using tone distributions

    Ton dağılımları kullanan Türkçe duygu sözlüğü geliştirilmesi

    MUAZZEZ ŞULE KARAŞLAR

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. BURKAY GENÇ

  4. Otomatik duygu sözlüğü geliştirilmesi ve haberlerin duygu analizi

    Automated sentiment lexicon generation and sentiment analysis of news

    FATİH SAĞLAM

    Doktora

    Türkçe

    Türkçe

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ FUAT AKAL

    PROF. DR. HAYRİ SEVER

  5. A perceived service quality model in the sharing economy: The case of Airbnb

    Paylaşım ekonomisinde algılanan hizmet kalitesi modeli: Airbnb örneği

    MURAT AÇAR

    Doktora

    İngilizce

    İngilizce

    2019

    İşletmeBoğaziçi Üniversitesi

    İşletme Ana Bilim Dalı

    PROF. DR. AYŞE GÜL TOKER