Detecting hate speech in Turkish texts

Türkçe metinlerde nefret söylemi tespiti

PDF İndir

Tez No: 632497
Yazar: ZEHRA MELCE HÜSÜNBEYİ
Danışmanlar: DOÇ. DR. ARZUCAN ÖZGÜR TÜRKMEN
Tez Türü: Yüksek Lisans
Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
Anahtar Kelimeler: Belirtilmemiş.
Yıl: 2020
Dil: İngilizce
Üniversite: Boğaziçi Üniversitesi
Enstitü: Fen Bilimleri Enstitüsü
Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
Bilim Dalı: Belirtilmemiş.
Sayfa Sayısı: 65

Özet

Yazılı basın ve sosyal medya gibi birçok farklı mecrada önyargılı ve ayrımcı bir dilin kullanıldığı ve yaygınlaştığı görülmektedir. Demokrasi ve insan hakları değerlerine karşı tehdit oluşturan ayrımcı dil ve onun daha saldırgan ve aşağılayıcı, açıkça hedef gösterici şekliyle nefret söylemi acilen çözülmesi gereken küresel bir sorun teşkil etmektedir. Biz de nefret söylemiyle mücadelede önemli olan nefret söylemi tespiti için bir model geliştirdik. Bu amaçla, Hrant Dink Vakfı'nın sistematik bir şekilde nefret söylemi bağlamında annotate ettiği yazılı basın haberlerini PRNet medya takip şirketi web sitesinden çekerek bir dataset oluşturduk. Bildiğimiz kadarıyla, bu çalışmayla, etiketlenmiş bir dataset üzerinde çalışan Türkçe için geliştirilmiş ilk model üretilir. Özellikle yazılı basın haberlerindeki nefret söyleminin büyük kısmının bağlam ve imala-ra dayanması değişen söylemsel ipuçlarını tespit edebilen ve bu söylemlerin etrafında oluşan bağlamı anlayabilen bir sistem gerektirir. Biz de metnin hiyerarşik yapısını kullanarak ifadelerin değişen anlamlarını yakalamayı hedefleyen Hiyerarşik İlgi Ağları (HİA) modelini farklı kelime temsilleriyle inceledik. Modelimizi metin işlemede önemli sonuçlar veren Konvolüsyonel Sinir Ağları ve makine öğrenmesi modelleriyle kıyaslaya-rak probleme uygunluğunu tespit ettik. Çalışmamızı geliştirmek için eleştirel söylem analizi tekniklerini temel alarak probleme yönelik dilbilimsel özellikler geliştirdik. HİA modelini bu özelliklerle birlikte zenginleştirdik. Sonuçlarımız 'diğerleri dili' kullanımına işaret eden özellik kümesiyle performansın geliştiğini gösterir. Türkçe dili için oluşturu-lan bu özellik kümelerinin nefret söyleminin nicel analizinde yeni çalışmaları teşvik edeceğine inanıyoruz.

Özet (Çeviri)

It is well known that prejudiced and discriminatory language is being widely used and spread through several channels such as printed or social media. The discriminatory language, in particular hate speech as its more aggressive, degrading and openly targeting form, which poses a threat to the values of democracy and human rights is a global problem that needs an immediate solution. Since we find the detection of hate speech important in the fight against hate speech, we have developed a model to detect it. For this purpose, we created a dataset by retrieving printed media news that the Hrant Dink Foundation systematically annotated in the context of hate speech from the website of the PRNet media monitoring company. To the best of our knowledge, with this study, the first model developed for Turkish language that runs on a labeled dataset is produced. In particular, the fact that most of the hate speech in printed media is based on context and implications requires a system that can detect changing discursive cues and understand the context around these discourses. With different word representations, we have examined the Hierarchical Attention Network (HAN) model, which aims to capture the changing meanings of expressions by using the hierarchical structure of the text. We studied the compatibility of our model with the problem by comparing it with Convolution Neural Network (CNN), which provided important results in text processing, and with machine learning models. In order to improve our study, we developed linguistic features for the problem based on critical discourse analysis techniques. We enhanced the HAN model using these features. Our results show that performance increases with a set of features that point out the use of 'othering language'. We believe that these feature sets created for the Turkish language will encourage new studies in the quantitative analysis of hate speech.

Benzer Tezler

Tez No
844774
Sosyal medyadaki nefret söylemi içeren yayınların tespitinde yapay zeka temelli makine öğrenmesi algoritmalarının performans değerlendirmesi
Performance evaluation of artificial intelligence based machine learning algorithms in detecting publications containing hate speech on social media
KADİR TURGUT
Yüksek Lisans
Türkçe
2023
Mühendislik Bilimleri İstanbul Gedik Üniversitesi
Yapay Zeka Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ AYTAÇ UĞUR YERDEN
Tez No
867041
Derin öğrenme yöntem ve modelleri kullanılarak sosyal mühendislik saldırılarının tespitinde yeni yaklaşımların geliştirilmesi
Development of new approaches in detecting social engineering attacks using deep learning methods and models
ZEYNEP ASLANPENÇESİ
Yüksek Lisans
Türkçe
2024
Bilim ve Teknoloji Fırat Üniversitesi
Yazılım Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ MUHAMMET BAYKARA
Tez No
858034
Sosyal medyada yapay zekâ ile nefret söylemi tespiti
Detection of hate speech on social media with artificial intelligence
ÇAĞLA AKSOY
Doktora
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Gazi Üniversitesi
Adli Bilişim Ana Bilim Dalı
PROF. DR. ŞEREF SAĞIROĞLU
DR. MUSTAFA UMUT DEMİREZEN
Tez No
957520
Transformer tabanlı modellerle Türkçe tweetlerdeki argo dilin tespiti
Detection of offensive language in Turkish tweets using transformer based models
ZEYNEP ŞEBNEM ÜZMEZ
Yüksek Lisans
Türkçe
2025
Mühendislik Bilimleri Fırat Üniversitesi
Yazılım Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ SİNEM AKYOL
Tez No
945726
Makine öğrenmesi teknikleri kullanılarak siber zorbalık tespiti ve sınıflandırılması
Cyberbullying detection and classification using machine learning techniques
MOKHTAR ALFALOUJI
Yüksek Lisans
Türkçe
2025
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Kütahya Dumlupınar Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ EBRU EFEOĞLU

Geri Dön