Geri Dön

Sosyal medya verilerinde derin öğrenme modelleri ile ırkçılık ve yabancı düşmanlığı tespiti

Detection of racism and xenophobia with deep learning models on social media data

  1. Tez No: 847750
  2. Yazar: ŞULE KAYA
  3. Danışmanlar: PROF. DR. BİLAL ALATAŞ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Bilim ve Teknoloji, Computer Engineering and Computer Science and Control, Science and Technology
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: Türkçe
  9. Üniversite: Fırat Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Yazılım Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 43

Özet

Dijital çağın öne çıkan yeniliklerinden biri, sosyal medya platformlarının insanlara düşüncelerini, duygularını ve deneyimlerini anında milyonlarca kişiyle paylaşma imkanı sunmasıdır. Bu etkileşimler, toplumsal bütünlüğü tehdit edebilecek ırkçı ve yabancı düşmanı içeriklerin hızla yayılmasına da yol açabilmektedir. Bu çalışma, Twitter gibi sosyal medya platformlarında bu tür zararlı mesajların yüksek doğrulukla otomatik olarak tespit edilmesini sağlayacak bir derin öğrenme modelinin geliştirilmesini amaçlamaktadır. Hipotezimiz, hibrit bir yaklaşımı benimseyen modelin, mevcut metin sınıflandırma tekniklerinden daha üstün performans göstereceğidir. Araştırma sürecinde, 01 Ocak 2020 ile 01 Ekim 2022 tarihleri arasında Python ile toplanan tweetler, etnik ve milli kimliklere yönelik ayrımcı dil kullanımını içeren ve içermeyen olarak iki kategoriye ayrılmış ve analiz edilmiştir. Metin ön işleme, tokenizasyon, ve sayısal vektörlere dönüştürme işlemleri gerçekleştirilmiş, ardından çift yönlü KTN katmanları ve çok başlıklı dikkat mekanizmalarını içeren ileri düzey modellemeler uygulanmıştır. Çapraz doğrulama yöntemiyle yapılan değerlendirmeler sonucunda, modelin ortalama %62.92 doğruluk oranı ile nefret söylemi içeren mesajları etkili bir şekilde sınıflandırdığı belirlenmiştir. Bu bulgular, modelin sosyal medya metinlerindeki zararlı içerikleri sınıflandırma kapasitesine dair değerli bilgiler sunmakta ve ırkçılık ile yabancı düşmanlığının otomatik tespiti konusunda sosyal medya platformlarına ve ilgili kurumlara stratejik bir rehberlik etmektedir.

Özet (Çeviri)

One of the most notable innovations of the digital age is the ability of social media platforms to allow individuals to instantly share their thoughts, feelings, and experiences with millions of people. These interactions can also lead to the rapid spread of racist and xenophobic content that may threaten social cohesion. This study aims to develop a deep learning model that can automatically detect such harmful messages with high accuracy on social media platforms like Twitter. Our hypothesis is that a model adopting a hybrid approach will outperform current text classification techniques. During the research process, tweets collected using Python from January 1, 2020, to October 1, 2022, were categorized into those containing discriminatory language against ethnic and national identities and those that did not. Text preprocessing, tokenization, and conversion into numerical vectors were performed, followed by the application of advanced modeling with bidirectional GRU layers and multi- headed attention mechanisms. The evaluations conducted using the cross-validation method determined that the model effectively classifies messages containing hate speech with an average accuracy rate of 62.92%. These findings provide valuable insights into the model's capacity to classify harmful content in social media texts and offer strategic guidance for social media platforms and related institutions in the automatic detection of racism and xenophobia.

Benzer Tezler

  1. Machine learning of social media data on a spatio-temporal basis

    Sosyal medya verilerinin zaman-mekansal temellere göre makine öğrenimi

    BÜŞRA YEŞİLBAŞ

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGalatasaray Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. TANKUT ACARMAN

  2. Transformer tabanlı modellerle Türkçe tweetlerdeki argo dilin tespiti

    Detection of offensive language in Turkish tweets using transformer based models

    ZEYNEP ŞEBNEM ÜZMEZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2025

    Mühendislik BilimleriFırat Üniversitesi

    Yazılım Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ SİNEM AKYOL

  3. Sentiment analysis of social network data using machine learning

    Sosyal ağ verileri kullanarak makine görüş analizi öğrenme

    ALI ABAS ALO ALBABAWAT

    Yüksek Lisans

    İngilizce

    İngilizce

    2017

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. GALİP AYDIN

  4. Social media based crime prediction using machine learning

    Makine öğrenme algoritmasını kullanarak sosyal medya tabanlı suç tahmini

    SAKIRIN TAM

    Doktora

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAnkara Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    Assoc. Prof. Dr. ÖMER ÖZGÜR TANRIÖVER

  5. Doğal afetlerde çevrimiçi davranış verilerine dayalı ihtiyaç tahmini ve kaynak tahsis optimizasyonu: 2023 kahramanmaraş depremleri uygulaması

    Demand prediction and resource allocation optimization based on online behavioral data in natural disasters: An application to the 2023 Kahramanmaraş earthquakes

    MEHMET DEMİR

    Yüksek Lisans

    Türkçe

    Türkçe

    2025

    Endüstri ve Endüstri MühendisliğiHacettepe Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ERDİ DAŞDEMİR