Identification of cyberbullying using machine learning techniques
Makine öğrenmesi tekniklerini kullanarak siber zorbalığın tespiti
- Tez No: 872192
- Danışmanlar: PROF. DR. SELMA AYŞE ÖZEL
- Tez Türü: Doktora
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: İngilizce
- Üniversite: Çukurova Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 147
Özet
Sosyal medya platformlarının yaygın kullanımı, aralarında siber zorbalığın da önemli bir endişe kaynağı olduğu çok sayıda tehdidi beraberinde getirmiştir. Siber zorbalık, bir mağdura zarar vermek amacıyla ahlak dışı davranışlarda bulunmak için elektronik veya dijital medyanın tekrarlı kullanımı olarak tanımlanmaktadır. Hem Türkiye'de hem de dünyada siber zorbalık, depresyon, stres, anksiyete ve aşırı durumlarda intiharı da içerebilen derin duygusal ve psikolojik yansımaları nedeniyle acil dikkat gerektiren bir konu olarak kabul edilmektedir. Bu endişe için çok sayıda araştırmacı ve bilim insanı makine öğrenimi (ML), derin öğrenme (DL) ve doğal dil işleme (NLP) tekniklerinden yararlanarak çözümler geliştirmeye çalışmıştır. Bu çabalar, siber zorbalığı metinsel bağlamlar içinde tanımlayabilen modeller oluşturmayı ve nihai hedef olarak bu tür içeriği tespit edip kaldırmayı ya da yayılmasını önlemeyi amaçlamaktadır. Ancak, bu alandaki çalışmaların büyük çoğunluğu İngilizce dilinde yapılmış olup, Türkçe dilinde yapılan araştırma sayısı oldukça azdır. Dahası, mevcut çalışmalar analizlerini genellikle İngilizce ve Türkçe arasında ayırmakta ve potansiyel diller arası nüansları göz ardı etmektedir. Literatürdeki bu boşluklardan hareketle bu tez, hem İngilizce hem de Türkçe dillerinde siber zorbalığın tespitini ele almaya çalışmaktadır. İkili metin sınıflandırma problemi olarak çerçevelenen araştırma, birleşik bir yaklaşımın farklı dilsel bağlamlarda siber zorbalığı etkili bir şekilde tespit edip edemeyeceğini anlamayı amaçlayarak diller arasında standart tekniklerin etkinliğini incelemektedir. Bu amaca ulaşmak için ML, DL ve büyuk dil modelinin (LLM) karşılaştırmalı değerlendirmesi de dahil olmak üzere kapsamlı deneyler gerçekleştirilmiştir. Ayrıca, geleneksel özellik ağırlıkları ve kelime katıştırmaları da dahil olmak üzere bir dizi özellik çıkarma tekniği titizlikle değerlendirilmiştir. Ek olarak, LLM'ye uygulanan bir optimizasyon tekniği olan LoRA'nın etkinliği kapsamlı bir şekilde değerlendirilmiştir. Ayrıca, etiketli verilerin azlığının yarattığı zorluğun farkına varılarak, yeni bir yarı denetimli öğrenme tekniği önerilmiştir. Özellikle, kendi kendini eğiten büyük bir Dil Modeli uygulanmış, etiketli ve etiketsiz verilerin bir kombinasyonundan yararlanarak sınıflandırma performansını artırma potansiyeli gösterilmiş ve böylece manuel etiketleme işlemlerinin kaynak yoğun doğası hafifletilmiştir. Bu araştırma, siber zorbalık tespit yöntemlerinin geliştirilmesine katkıda bulunmakta ve dijital alanda siber zorbalıkla mücadele etmek için diller arasında daha kapsayıcı yaklaşımları teşvik etmektedir.
Özet (Çeviri)
The pervasive utilization of social media platforms has introduced a multitude of threats, among which cyberbullying stands as a significant concern. Cyberbullying is defined as the repetitive use of social and electronic media, to perpetrate immoral actions with the intent to inflict harm upon a victim. In both Turkey and globally, cyberbullying is recognized as a pressing issue necessitating urgent attention due to its profound emotional and psychological repercussions, which can include depression, stress, anxiety, and in extreme cases, suicide. For this concern, numerous researchers and scientists have endeavored to develop solutions leveraging machine learning (ML), deep learning (DL), and natural language processing (NLP) techniques. These efforts aim to create models capable of identifying cyberbullying within textual contexts, with the ultimate goal of either detecting and removing such content or preventing its dissemination. However, the large number of studies in this context have been conducted in English, with a dearth of research in Turkish language. Moreover, existing studies often segregate their analyses between English and Turkish, overlooking potential cross-linguistic nuances. Motivated by these gaps in the literature, this thesis endeavors to address the detection of cyberbullying in both English and Turkish languages. Framed as a binary text classification problem, the research scrutinizes the efficacy of standard techniques across languages, aiming to discern whether a unified approach can effectively detect cyberbullying in diverse linguistic contexts. To achieve this objective, comprehensive experiments are conducted, including the comparative evaluation of ML, DL, and Large Language model (LLM) Furthermore, an array of feature extraction techniques, including traditional feature weightings and word embeddings, are rigorously assessed. Additionally, the efficacy of an optimization technique LoRA, applied to LLM, is thoroughly evaluated. Furthermore, recognizing the problem created by labeled data shortage, a novel semi-supervised learning technique is proposed. Specifically, a self-training with LLM is implemented, demonstrating its potential to enhance classification performance by leveraging a blend of both labeled and unlabeled data, thereby mitigating the resource-intensive nature of manual labeling processes. This research contributes to advancing cyberbullying detection methods and encourages more inclusive approaches across languages to combat cyberbullying in the digital sphere.
Benzer Tezler
- Otizm spektrum bozukluğu tanılı olgularda internet bağımlılığı ve zorbalık ile ilişkili faktörlerin incelenmesi
Investigation of parameters related to internet spending and bullying in cases with autism spectrum disorder
ZEYNEP GÖKÇE ERKAN İDRİS
Tıpta Uzmanlık
Türkçe
2023
PsikiyatriEge ÜniversitesiÇocuk ve Ergen Psikiyatrisi Ana Bilim Dalı
DOÇ. DR. SEZEN KÖSE
- Iğdır Futbol Kulübü taraftarlarının kişilik özellikleri, taraftarlık ve siber zorbalık düzeyleri üzerine betimsel bir araştırma
A descriptive research on personality characteristics, fans and cyber bullying levels of Iğdır Football Club fans
MUHAMMET KÜRŞAT URUŞ
Yüksek Lisans
Türkçe
2024
SporIğdır ÜniversitesiBeden Eğitimi ve Spor Ana Bilim Dalı
DOÇ. DR. ÜNSAL TAZEGÜL
- 11-15 yaş arası ergenlerde okul yaşamı zorbalığı ve siber zorbalığın bazı demografik özellikler açısından incelenmesi
Researching teenagers aged between 11-15 about bulling at school and cyber bullying according to demographic specifications
ESRA DEMİRCİ
Yüksek Lisans
Türkçe
2017
PsikolojiNişantaşı ÜniversitesiPsikoloji Ana Bilim Dalı
YRD. DOÇ. DR. NURGÜL YAVUZER
- Lise öğrencilerinde siber zorbalık ve siber mağduriyetin benlik saygısı, anne, baba ve akran ilişkileri açısından incelenmesi
A study on the cyber bullying and cyber victimization among the high school students with regard to self-esteem, relations with the mother, father and peers.
DEMET PEKŞEN SÜSLÜ
- Dikkat eksikliği hiperaktivite bozukluğu olan çocuk ve ergenlerin siber zorbalık ve mağduriyeti ile ilişkili etmenlerin araştırılması
Investigation of factors associated with cyber bullying and victimization among children and adolescents with attention deficit hyperactivity disorder
REZZAN AYDIN GÖRÜCÜ
Tıpta Uzmanlık
Türkçe
2016
PsikiyatriAnkara ÜniversitesiÇocuk Ruh Sağlığı ve Hastalıkları Ana Bilim Dalı
PROF. DR. CİHAT KAĞAN GÜRKAN