Hate speech detection in turkish news using a transformer-based model enhanced with linguistic features
Dilbilimsel özellikler ile desteklenen dönüştürücü tabanlı model kullanılarak türkçe haberler üzerinde nefret söylemi tespiti
- Tez No: 762674
- Danışmanlar: DOÇ. DR. ARZUCAN ÖZGÜR TÜRKMEN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: İngilizce
- Üniversite: Boğaziçi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Bilimleri Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 66
Özet
Etnik kökenlere, milliyetlere, dini kimliklere ve belirli gruplara yönelik nefret söylemi sadece sosyal medyada değil, yazılı basında da artmaktadır. Bu artış basılı medyada okuyuculara sunulmadan önce nefret söylemi açısından hızlıca gözden geçirip filtreleyebilen otomatik nefret söylemi tespit sistemlerine ihtiyacı oluşturmaktadır. Ancak mevcut otomatik nefret söylemi tespit modellerinin çoğu haber metinlerinde sıklıkla kullanılan hedef grubuna özgü söylemi dikkate almadan nefret söylemini tespit etmekle sınırlıdır. Ayrıca nefret söylemi alanında Türkçe yazılı basın makalelerini içeren az sayıda veri seti bulunmaktadır. Bu çalışmada nefret söylemi tespiti için birçok hedef grup odaklı dilbilimsel özelliklerle zenginleştirilmiş BERT tabanlı yeni bir model önerilmiştir. Klasik yaklaşım olan BERT kodlayıcının sadece ilk gizli vektörünü kullanmak yerine farklı BERT gizli vektörlerini ağırlıklandırmanın etkileri de araştırılmıştır. Gizli vektörleri birleştirmek için farklı dikkat katmanı tekniklerini kapsayan BERT tabanlı modeller önerilmiştir. Nefret söylemi etiketi ile birlikte nefret söylemi olarak etiketlenen haberlerin hedef kitlesinin de belirtildiği önceden işlenmiş yeni bir Türkçe nefret söylemi veri kümesi de yayınlanacaktır. Bu kapsamlı Türkçe yazılı basın veri seti üzerinde yapılan deneyler, önceki yaklaşımlara kıyasla doğruluk ve F1 puanı açısından rekabetçi bir performansın elde edildiğini göstermektedir.
Özet (Çeviri)
Hate speech directed at ethnicities, nationalities, religious identities, and specific groups has increased not only in social media, but also in print media. This creates a need for automated hate speech detection systems that can quickly review and filter print media content before it is provided to readers if it contains hate speech. However, most of the existing automatic hate speech detection models are limited to detecting hate speech without considering the hate speech target group-specific discourse that is often used in news articles. Moreover, there are few datasets that include Turkish print media articles in the hate speech domain. In this study, a new BERT based model enriched with a set of target-oriented linguistic features for hate speech detection is proposed. The effects of weighting different BERT hidden vectors are also investigated, instead of using only the first hidden vector of the BERT encoder, which is the classical approach. New BERT based models that integrate different attention techniques are proposed for combining hidden vectors. A new preprocessed Turkish dataset for hate speech is also published, in which the target group for all hate speech articles is annotated. Experiments on a comprehensive Turkish dataset of news articles labeled for hate speech show that competitive performance in terms of accuracy and F1-score is achieved compared to previous approaches.
Benzer Tezler
- Detecting hate speech in Turkish texts
Türkçe metinlerde nefret söylemi tespiti
ZEHRA MELCE HÜSÜNBEYİ
Yüksek Lisans
İngilizce
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. ARZUCAN ÖZGÜR TÜRKMEN
- Türk basınında düzensiz göçün görsel temsili: Taliban yönetimi sonrası Afgan göçü
Visual representation of irregular migration in the Turkish press: Afghan migration after the Taliban regime
ZİNDAN ÇAKICI
Doktora
Türkçe
2024
GazetecilikGalatasaray ÜniversitesiRadyo Televizyon ve Sinema Ana Bilim Dalı
DOÇ. DR. EMİNE NAZLI AYTUNA
- Sosyal medyada yapay zekâ ile nefret söylemi tespiti
Detection of hate speech on social media with artificial intelligence
ÇAĞLA AKSOY
Doktora
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiAdli Bilişim Ana Bilim Dalı
PROF. DR. ŞEREF SAĞIROĞLU
DR. MUSTAFA UMUT DEMİREZEN
- Türkçe hakaret ve nefret söylemi tespiti
Offensive language and hate speech detection in Turkish
MEHMET SALİH KURT
Doktora
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Üniversitesi-CerrahpaşaBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. EYLEM YÜCEL DEMİREL
- Çevrimiçi sosyal ağlarda derin öğrenme ve hibrit metasezgisel algoritma tabanlı nefret söylemi tespit sistemi
Deep learning and hybrid metaheuristic algorithm based hate speech detection system in online social networks
VAHTETTİN CEM BAYDOĞAN
Doktora
Türkçe
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat ÜniversitesiYazılım Mühendisliği Ana Bilim Dalı
PROF. DR. BİLAL ALATAŞ