Çevrimiçi sosyal ağlarda rahatsız edici davranış tespiti ve azaltma stratejileri
Misbehaviour detection and mitigation strategies in online social networks
- Tez No: 847591
- Danışmanlar: DOÇ. DR. AYŞE BERNA ALTINEL GİRGİN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: Türkçe
- Üniversite: Marmara Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 61
Özet
Çevrimiçi platformlarda nefret söylemi, bireylere veya gruplara karşı ayrımcılığı, düşmanlığı veya önyargıyı teşvik eden dil veya ifadenin kullanılması anlamına gelir. İnsanlar çevrimiçi platformlarda gerçek hayatta olduğundan daha kolay nefret söylemi yapabilmektedir. Aslında, bu nefret söylemi yapan kullanıcılar daha hızlı bir şekilde daha fazla kitleye ulaşabilirler. Ancak, bu nefret dolu konuşmalar, bazı bireyler için zararlı olabilir. Çevrimiçi platformlarda nefret söyleminin ele alınması, ifade özgürlüğü ile bireyleri zarardan koruma ihtiyacı arasında hassas bir denge kurulmasını gerektirir. Bu nedenle, nefret söyleminin etkili bir şekilde tespit edilmesi, güvenli ve kapsayıcı bir dijital ortamın sürdürülmesi açısından büyük önem taşımaktadır. Bu çalışmada, üç farklı Türkçe nefret söylemi tespit veri kümesi kullanılmıştır, bunlardan ikisi özel olarak bu çalışma için hazırlanmıştır ve Türkçe tweetler üç farklı sınıfa ayrılmıştır: nefret söylemi, saldırgan ifade ve hiçbiri. Bu çalışma, makine öğrenimi ve derin öğrenme modelleri de dahil olmak üzere, nefret söyleminin tespitine yönelik çeşitli yaklaşımları incelemektedir. Kelime gömme oluşturmak için kullanılan çeşitli teknikler arasında Terim Frekansı (TF), CBOW ve Skip-Gram modellerini kullanarak Word2Vec, PV-DM ve PV-DBOW yaklaşımlarını kullanarak Doc2Vec, GloVe, BERT yer almaktadır. Sınıflandırma aşamasında ise, Rastgele Orman (RO), Naive Bayes (NB), Destek Vektör Makineleri (DVM) gibi MÖ algoritmaları, Uzun Kısa Süreli Bellek (UKSB) ile Çift Yönlü UKSB gibi derin öğrenme yaklaşımları ve textGCN kullanılmaktadır. Alg-2 sınıflandırıcısı, %75 eğitim ve %25 test verisi kullanılarak yapılan konfigürasyonda 9k veri setinde en iyi performansı sergileyerek %92.34 F1 skoruna ulaşmıştır.
Özet (Çeviri)
Hate speech on online platforms refers to the use of language or expression that propagates discrimination, hostility, or prejudice towards individuals or groups. People can make hate speech on online platforms more easily than in real life. In fact, users who make this hate speech can reach more audiences faster. However, these hateful speeches may be harmful to some individuals. Addressing hate speech on online platforms involves striking a delicate balance between freedom of expression and the need to protect individuals from harm. Thus, effective detection of hate speech is crucial to maintaining a safe and inclusive digital environment. Three distinct Turkish hate speech detection datasets were employed in this study, two of which were specifically prepared for this study, and Turkish tweets are labeled into three different classes, namely hate speech, aggressive expression, and neither. This study examines various approaches to hate speech detection, including machine learning and deep learning models. Several techniques employed for generating word embeddings, including Term Frequency (TF), Word2Vec using Continuous Bag-of-Words (CBOW) and Skip-gram models, Doc2Vec utilizing Paragraph Vector-Distributed Memory (PV-DM) and Paragraph Vector-Distributed Bag of Words (PV-DBOW) approaches, GloVe, and BERT. In the classification phase, machine learning algorithms such as Random Forest, Naive Bayes, Support Vector Machines, and deep learning approaches like Long Short-Term Memory (LSTM), Bidirectional LSTM (BiLSTM) and Text Graph Convolutional Network (textGCN) are used. The Alg-2 classifier demonstrated the best performance, achieving an F1-score of 92.34% when trained with 75% and tested with 25% of the 9k dataset.
Benzer Tezler
- Privacy and utility-based decision making for sharing posts in online social networks
Çevrimiçi sosyal ağlarda gönderi paylaşımına dair mahremiyet ve fayda temelli karar alma
TARIK BERKANT KEPEZ
Yüksek Lisans
İngilizce
2017
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. PINAR YOLUM BİRBİL
- Sağlıkla ilgili sosyal medya forum verilerinde içeriğinin bilgilendirici özellikleri: İlaç yan etkilerinin araştırılması üzerine bir çalışma
Informational characteristics of health-related social media content: A study on the investigation of drug side effects
ALKAN KAYA
Yüksek Lisans
Türkçe
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Okan ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. PINAR YILDIRIM
- Spam detection by using word-vector learning algorithm in online social networks
Çevrimiçi sosyal ağlarda kelime-vektör öğrenme algoritması kullanarak spam belirleme
ASO KHALEEL AMEEN SALIHI
Yüksek Lisans
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat ÜniversitesiYazılım Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ BUKET KAYA
- Negotiating privacy constraints in online social networks
Çevrimiçi sosyal ağlarda mahremiyet sınırlarının müzakeresi
YAVUZ MESTER
Yüksek Lisans
İngilizce
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. PINAR YOLUM BİRBİL
- Argumentation for protecting users' privacy in online social networks
Çevrimiçi sosyal ağlarda kullanıcıların mahremiyetinin münakaşa ile korunması
NEFİSE GİZEM YAĞLIKÇI
Yüksek Lisans
İngilizce
2016
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. PINAR YOLUM BİRBİL