Geri Dön

Multilingual, multimodal and explainable approaches for automated fact-checking problem

Otomatik doğrulama problemi için çok dilli, çok modlu ve açıklanabilir yaklaşımlar

  1. Tez No: 921223
  2. Yazar: RECEP FIRAT ÇEKİNEL
  3. Danışmanlar: PROF. DR. PINAR KARAGÖZ
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Dilbilim, Computer Engineering and Computer Science and Control, Linguistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2025
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 136

Özet

Otomatik doğruluk kontrolü yöntemleri, ağırlıklı olarak içerik tabanlı yaklaşımlara dayanmakta ve tahmin için metinden sofistike özellikler çıkarmak üzere derin sinir ağlarını kullanmaktadır. Ancak, bu modellerin doğası gereği kara kutu oluşu, karar verme süreçlerinin anlaşılmasını zorlaştırmaktadır. Otomatik doğruluk kontrolü modelleri için bir diğer zorluk, dil spesifik verilere olan bağımlılıklarıdır ve eğitim için mevcut çok dilli veri kümeleri sınırlıdır. Ayrıca, sahte gönderilerin metin, görseller ve konuşma gibi çok modlu yapısı ek bir zorluk teşkil etmektedir. Bu tez, otomatik doğruluk kontrolü araştırmalarını ele alarak iddiaların doğruluklarını tahmin etmeyi hedeflemekte ve doğruluk kontrolü ile alaycılık tespiti için açıklanabilir çözümler geliştirmeye katkı sağlamaktadır. Çok görevli öğrenme ve nedensel çıkarım yoluyla açıklanabilir modeller önermekte, düşük kaynaklı diller için çapraz dilli aktarım yoluyla öğrenimini değerlendirmekte ve son dönemdeki Görsel-Dil Modellerining (GDM) doğruluk kontrolü için metin ve görsel bilgiyi nasıl kullandığını incelemekteyiz. Çok görevli öğrenme yaklaşımımız, metin özetleme ve doğruluk tahmini için eğitilmiş T5 tabanlı bir kodlayıcı-çözücü modelini içermektedir; oluşturulan özetler, tahmin edilen doğruluk etiketleri için açıklamalar olarak kullanılmaktadır. Ayrıca, Türkçe bir doğruluk kontrolü veri kümesi yayımlanmış ve veri yetersizliğini ele almak için transfer öğrenimi ve makine çevirisi kullanılarak deneyler gerçekleştirilmiştir. Çok modluluk bağlamında, GDM'nin metin ve görsel bilgiyi temsil etme etkinliğini araştırmakta ve çok modlu gömme yöntemlerinin genelde performansı artırmasına rağmen, yalnızca metin veya yalnızca görsel tabanlı modellerin sıklıkla daha iyi sonuç verdiğini bulmaktayız. Son olarak, metin analizinde nedensel çıkarımı uygulayarak alaycı dilsel özelliklerin ve noktalamanın metin popülerliği üzerindeki etkisini incelemekte ve ironi ve popülerlik hakkında örtük bilgileri ortaya çıkarmak için kümeleme ve konu modellemeyi kullanmaktayız.

Özet (Çeviri)

Automated fact-checking methods primarily rely on content-based approaches, utilizing deep neural networks to extract sophisticated features from text for prediction. However, the inherently black-box nature of these models makes their decision-making processes challenging to interpret. Another challenge for automated fact-checking models is their dependence on language-specific data, with limited multilingual datasets available for training. Moreover, the multimodal nature of fake posts—including text, images, and speech—presents an additional challenge. This thesis addresses automated fact-checking research, aiming to predict the veracity of claims while extending contributions to explainable solutions for fact-checking and sarcasm detection. We propose explainable models through multi-task learning and causal inference, evaluate cross-lingual transfer learning for low-resource languages, and examine how recent VLMs utilize text and image information for fact-checking. Our multi-task learning approach involves a T5-based encoder-decoder model trained for text summarization and veracity prediction, with generated summaries serving as explanations for predicted veracity labels. Moreover, a Turkish fact-checking dataset is released and experiments are conducted using transfer learning and machine translation to address data scarcity. In multimodality, we investigate VLMs' effectiveness in representing text and image information, finding that while multimodal embeddings generally enhance performance, discrete text-only and image-only models often outperform them. Lastly, we apply causal inference to text analysis, examining how sarcastic linguistic features and punctuation impact text popularity and leveraging clustering and topic modeling to uncover latent information on irony and popularity.

Benzer Tezler

  1. The use of translanguaging in integrated performance assessment tasks in EFL classes

    Yabancı dil olarak İngilizce sınıflarında bütünleşik performans değerlendirme etkinliklerinde dil alaşımı kullanımı

    EREN DOĞUKAN KELEŞ

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Eğitim ve ÖğretimYıldız Teknik Üniversitesi

    Yabancı Diller Eğitimi Ana Bilim Dalı

    DOÇ. DR. BURCU ÜNAL

  2. Bir kültür ve çeviri rotası olarak Likya yolu: Çeviri sosyolojisi odağında çözümlemeler

    The Lycian way as a cultural and translation route: An analysis with a focus on the sociology of translation

    SAİD EMRE ŞİRİN

    Yüksek Lisans

    Türkçe

    Türkçe

    2025

    Mütercim-TercümanlıkYıldız Teknik Üniversitesi

    Batı Dilleri ve Edebiyatları Ana Bilim Dalı

    DOÇ. DR. ZEYNEP GÖRGÜLER

  3. Detection of phishing web pages by combining semantical and visual information

    Kimlik avcısı web sayfalarının anlamsal ve görsel bilgiyle tespiti

    AHMAD HANI ABDALLA ALMAKHAMREH

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ AHMET SELMAN BOZKIR

  4. Talking to your data: building a multimodal rag console for real time voice and text interaction

    Çok modlu geri getirme destekli sohbet yapay zekâ konsolu: tasarım, uygulama ve değerlendirme

    MOHAMUD OSMAN HAMUD

    Yüksek Lisans

    İngilizce

    İngilizce

    2025

    İstatistikOndokuz Mayıs Üniversitesi

    İstatistik Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ SERPİL AYDIN