Geri Dön

Early detection of fake news on emerging topics through weak supervision

Yeni ortaya çıkan konular üzerinde zayıf denetim yoluyla sahte haberlerin erken tespiti

  1. Tez No: 830779
  2. Yazar: SERHAT HAKKI AKDAĞ
  3. Danışmanlar: PROF. DR. FEHİME NİHAN ÇİÇEKLİ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 98

Özet

Bu tezde, zayıf denetim yoluyla ortaya çıkan yeni konularda sahte haberlerin erken tespiti sorununa yönelik yeni bir çözüm sunuyoruz. Geleneksel teknikler, etiketli verilerle denetimli öğrenmeye veya teyit organizasyonlarına dayanmaktadır. Bu yöntemler yeni ortaya çıkan konular için hazır olarak bulunmamaktadır. Bunu çözmek amacıyla, belirli bir alana ait büyük ölçekli bir metin veri kümesini programlı olarak etiketlemek ve atanan etiketlerle denetimli metin sınıflandırıcılarını eğitmek için WeSTeC'i (Zayıf Denetimli Metin Sınıflandırma çerçevesi) sunuyoruz. Önerilen çerçeve, birden fazla zayıf etiketleme stratejisini birleştirir ve oluşturulan zayıf etiketleri tek bir birleştirilmiş zayıf etikete dönüştürür. Oluşturulan etiketler daha sonra sahte haber tespiti için önceden eğitilmiş RoBERTa sınıflandırıcısını ince ayarlamak için kullanılır. Zayıf etiketli veri kümesindeki sahte haberlerin yeni konuyla ilgili olduğu göz önüne alındığında, eğitilmiş sahte haber tespit modeli eldeki konuya özelleşir. Bu çalışmada yarı denetimli ve alan uyarlama kurulumlarınını ele alıyoruz. Bunlar sırasıyla az miktarda etiketli veri ve diğer alanlardaki etiketli veriyi kullanır. Önerilen modelin değerlendirmesi, oluşturulan birleştirilmiş zayıf etiketlerin kalitesi ve sahte haber tespit sınıflandırıcısı üzerinde yapılır. Her iki değerlendirmede de, tüm temel yöntemlerden daha iyi performans gösterir. Ayrıca, tamamen denetimli olarak eğitilen sahte haber tespit modeli ile karşılaştırıldığında, zayıf etiketlerle eğitilen model doğruluk açısından yüzde 0.1'e kadar yakın sonuçlar verir. Bu da önerilen çerçevenin zayıf etiketleme modülünün etkinliğini göstermektedir.

Özet (Çeviri)

In this thesis, we present a novel solution to the early detection of fake news problem on emerging topics through weak supervision. Traditional techniques rely on fact-checkers or supervised learning with labeled data, which is not readily available for emerging topics. To address this, we introduce end-to-end Weakly Supervised Text Classification framework, WeSTeC, to programmatically label a large-scale text dataset of a particular domain and train supervised text classifiers with the assigned labels. The proposed framework combines multiple weak labeling strategies and aggregates the generated weak labels into a single weak label per data instance. The generated labels are then used to fine tune a pre-trained RoBERTa classifier for fake news detection. By using the weakly labeled dataset containing fake news related to the emerging topic, the trained fake news detection model becomes specialized for the topic at hand. We consider both semi-supervision and domain adaptation setups, utilizing small amounts of labeled data and labeled data from other domains respectively. The proposed model is evaluated on both the quality of aggregated weak labels generated and the fake news detection classifier. In both evaluations, the model outperforms all baselines in each setup considered. In addition, when compared to the fully supervised counterpart, the fake news detection model trained on weak labels achieves an accuracy as close as 0.1\%, showing the effectiveness of the weak labeling module of the proposed framework.

Benzer Tezler

  1. Haber ve doğruluk ilişkisi: 'Yalan haber' ve haber doğrulama pratikleri

    The relationship between news and truth: 'Fake news' and fact-checking practices

    MEHMET BÜYÜKAFŞAR

    Doktora

    Türkçe

    Türkçe

    2019

    GazetecilikMarmara Üniversitesi

    Gazetecilik Ana Bilim Dalı

    DOÇ. DR. MEHMET ÖZÇAĞLAYAN

  2. Deepfake detection through motion magnification inspired feature manipulation

    Hareket büyütmesinden esinlenen öznitelik manipülasyonu ile derin sahtelerin tespiti

    AYDAMIR MIRZAYEV

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. HAMDİ DİBEKLİOĞLU

  3. Tasarımda iğrençlik kavramının üretken çekişmeli ağ algoritması ile değerlendirilmesi

    Evaluation of the concept of disgust in design with generative adversarial network algorithm

    EFECAN SOYSAL

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Mimarlıkİstanbul Teknik Üniversitesi

    Bilişim Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ETHEM GÜRER

  4. Başlangıcından izlenimcilik'e kadar resimde rengin simgesel kullanımı

    Usage of colours in painting as symbolls from the beginning until empressionism

    CEREN YILDIRIM

    Yüksek Lisans

    Türkçe

    Türkçe

    2009

    Güzel SanatlarMimar Sinan Güzel Sanatlar Üniversitesi

    Resim Ana Sanat Dalı

    PROF. AYDIN AYAN

  5. Early detection of forest fire from video utilizing temporal information

    Zamansal bilgiden faydalanarak videodan orman yangınlarının erken tespiti

    MERVE TAŞ

    Doktora

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAbdullah Gül Üniversitesi

    Elektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ KASIM TAŞDEMİR

    DOÇ. DR. ZAFER AYDIN