Geri Dön

Hate speech detection in turkish news using a transformer-based model enhanced with linguistic features

Dilbilimsel özellikler ile desteklenen dönüştürücü tabanlı model kullanılarak türkçe haberler üzerinde nefret söylemi tespiti

  1. Tez No: 762674
  2. Yazar: ATIF EMRE YÜKSEL
  3. Danışmanlar: DOÇ. DR. ARZUCAN ÖZGÜR TÜRKMEN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: İngilizce
  9. Üniversite: Boğaziçi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Bilimleri Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 66

Özet

Etnik kökenlere, milliyetlere, dini kimliklere ve belirli gruplara yönelik nefret söylemi sadece sosyal medyada değil, yazılı basında da artmaktadır. Bu artış basılı medyada okuyuculara sunulmadan önce nefret söylemi açısından hızlıca gözden geçirip filtreleyebilen otomatik nefret söylemi tespit sistemlerine ihtiyacı oluşturmaktadır. Ancak mevcut otomatik nefret söylemi tespit modellerinin çoğu haber metinlerinde sıklıkla kullanılan hedef grubuna özgü söylemi dikkate almadan nefret söylemini tespit etmekle sınırlıdır. Ayrıca nefret söylemi alanında Türkçe yazılı basın makalelerini içeren az sayıda veri seti bulunmaktadır. Bu çalışmada nefret söylemi tespiti için birçok hedef grup odaklı dilbilimsel özelliklerle zenginleştirilmiş BERT tabanlı yeni bir model önerilmiştir. Klasik yaklaşım olan BERT kodlayıcının sadece ilk gizli vektörünü kullanmak yerine farklı BERT gizli vektörlerini ağırlıklandırmanın etkileri de araştırılmıştır. Gizli vektörleri birleştirmek için farklı dikkat katmanı tekniklerini kapsayan BERT tabanlı modeller önerilmiştir. Nefret söylemi etiketi ile birlikte nefret söylemi olarak etiketlenen haberlerin hedef kitlesinin de belirtildiği önceden işlenmiş yeni bir Türkçe nefret söylemi veri kümesi de yayınlanacaktır. Bu kapsamlı Türkçe yazılı basın veri seti üzerinde yapılan deneyler, önceki yaklaşımlara kıyasla doğruluk ve F1 puanı açısından rekabetçi bir performansın elde edildiğini göstermektedir.

Özet (Çeviri)

Hate speech directed at ethnicities, nationalities, religious identities, and specific groups has increased not only in social media, but also in print media. This creates a need for automated hate speech detection systems that can quickly review and filter print media content before it is provided to readers if it contains hate speech. However, most of the existing automatic hate speech detection models are limited to detecting hate speech without considering the hate speech target group-specific discourse that is often used in news articles. Moreover, there are few datasets that include Turkish print media articles in the hate speech domain. In this study, a new BERT based model enriched with a set of target-oriented linguistic features for hate speech detection is proposed. The effects of weighting different BERT hidden vectors are also investigated, instead of using only the first hidden vector of the BERT encoder, which is the classical approach. New BERT based models that integrate different attention techniques are proposed for combining hidden vectors. A new preprocessed Turkish dataset for hate speech is also published, in which the target group for all hate speech articles is annotated. Experiments on a comprehensive Turkish dataset of news articles labeled for hate speech show that competitive performance in terms of accuracy and F1-score is achieved compared to previous approaches.

Benzer Tezler

  1. Detecting hate speech in Turkish texts

    Türkçe metinlerde nefret söylemi tespiti

    ZEHRA MELCE HÜSÜNBEYİ

    Yüksek Lisans

    İngilizce

    İngilizce

    2020

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ARZUCAN ÖZGÜR TÜRKMEN

  2. Türk basınında düzensiz göçün görsel temsili: Taliban yönetimi sonrası Afgan göçü

    Visual representation of irregular migration in the Turkish press: Afghan migration after the Taliban regime

    ZİNDAN ÇAKICI

    Doktora

    Türkçe

    Türkçe

    2024

    GazetecilikGalatasaray Üniversitesi

    Radyo Televizyon ve Sinema Ana Bilim Dalı

    DOÇ. DR. EMİNE NAZLI AYTUNA

  3. Sosyal medyada yapay zekâ ile nefret söylemi tespiti

    Detection of hate speech on social media with artificial intelligence

    ÇAĞLA AKSOY

    Doktora

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Adli Bilişim Ana Bilim Dalı

    PROF. DR. ŞEREF SAĞIROĞLU

    DR. MUSTAFA UMUT DEMİREZEN

  4. Türkçe hakaret ve nefret söylemi tespiti

    Offensive language and hate speech detection in Turkish

    MEHMET SALİH KURT

    Doktora

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Üniversitesi-Cerrahpaşa

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. EYLEM YÜCEL DEMİREL

  5. Çevrimiçi sosyal ağlarda derin öğrenme ve hibrit metasezgisel algoritma tabanlı nefret söylemi tespit sistemi

    Deep learning and hybrid metaheuristic algorithm based hate speech detection system in online social networks

    VAHTETTİN CEM BAYDOĞAN

    Doktora

    Türkçe

    Türkçe

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat Üniversitesi

    Yazılım Mühendisliği Ana Bilim Dalı

    PROF. DR. BİLAL ALATAŞ