Sosyal medyadaki Türkçe paylaşımlarda olası terör propagandasının makine öğrenimi algoritmaları ile sınıflandırılması
Classification of possible terrorist propaganda in Turkish shares on social media using machine learning algorithms
- Tez No: 876508
- Danışmanlar: DOÇ. DR. AHMET ÇEVİK
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: Türkçe
- Üniversite: Jandarma ve Sahil Güvenlik Akademisi
- Enstitü: Güvenlik Bilimleri Enstitüsü
- Ana Bilim Dalı: Suç Araştırmaları Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 68
Özet
Bu tezin amacı, Twitter'da terör örgütü propagandası içerikli Türkçe paylaşımların tespit edilmesinde farklı sınıflandırma algoritmalarının test edilerek başarı düzeylerinin tespit edilmesi ve bu algoritma sonuçlarından elde edilen verilerin kıyaslanması sonucunda içlerindeki en başarılı algoritmanın belirlenmesidir. Twitter üzerinden 10.000 tweet çekilmiş olup farklı ön işleme adımları uygulanarak 3.384 tweet ile çalışmada kullanılabilir nihai bir veri seti oluşturulmuştur. Nötr, Olumlu ve Olumsuz olarak manuel şekilde etiketlenen nihai veri seti ile Python programlama dili kullanılarak Gradient Boosting, Rastgele Orman, Multinominal Naive Bayes, Bernoulli Naive Bayes, CatBoost, SVM, Linear SVM algoritmaları test edilmiştir. Değerlendirme kriterleri olarak Doğruluk Oranı (Accuracy Rate), Kesinlik (Precision), Hassasiyet (Recall) ve F1-Puanı (F1-Score) metrikleri hesaplanmıştır. Bu tez kapsamında; Twitter'da terör örgütü propagandası içerikli Türkçe paylaşımların tespit edilmesinde test edilen algoritmalar için elde edilen sonuçlar anlamlandırılmış ve başarı oranları karşılaştırılmıştır. Araştırmanın sonucunda en yüksek doğruluk derecesine sahip algoritma %86 başarı oranını sağlayan“Linear SVM”olarak belirlenmiştir. Terör propagandası tespitine yönelik bu alanda yapılan çalışmalara bakıldığında, bu çalışma Türkçe dilinde çoklu sınıflandırma alanında öncü bir çalışma olmakla birlikte araştırmada kullanılmak üzere gerçek paylaşımlar kullanılarak sıfırdan oluşturulan veri seti ve sınıflandırmanın terör propagandası üzerine yapılması, çalışmanın en önemli katkısıdır. Bu tezde elde edilen bulgular, terör propagandası içeriğinin sınıflandırılması konusunda çeşitli algoritmaların etkinliğini ortaya koymuştur.
Özet (Çeviri)
The aim of this thesis is to test different classification algorithms in detecting Turkish posts containing terrorist organization propaganda on Twitter, to determine their success levels, and to determine the most successful algorithm among them as a result of comparing the data obtained from these algorithm results. 10,000 tweets were captured on Twitter, and by applying different pre-processing steps, a final data set that could be used in the study was created with 3,384 tweets. Gradient Boosting, Random Forest, Multinomial Naive Bayes, Bernoulli Naive Bayes, CatBoost, SVM, Linear SVM algorithms were tested using the Python programming language with the final data set manually labeled as Neutral, Positive and Negative. Accuracy Rate, Precision, Recall and F1-Score metrics were calculated as evaluation criteria. Within the scope of this thesis; The results obtained for the algorithms tested in detecting Turkish posts containing terrorist organization propaganda on Twitter were interpreted and their success rates were compared. As a result of the research, the algorithm with the highest degree of accuracy was determined as“Linear SVM”, which provides a success rate of 86%. As far as is known, when we look at the studies carried out in this field on the detection of terrorist propaganda, this study is a pioneering study in the field of multiple classification in Turkish language, but the most important contribution of the study is the data set created from scratch using real shares to be used in the research and the classification on terrorist propaganda. The findings obtained in this thesis revealed the effectiveness of various algorithms in classifying terrorist propaganda content.
Benzer Tezler
- Sosyal bilgiler öğretmen ve öğretmen adaylarının sosyal medyadaki tarihle ilgili paylaşımlara ilişkin görüşleri
The views of social studies teachers and teacher candidates related to the sharings on social media about history
DERYA ELBASAN
Yüksek Lisans
Türkçe
2019
Eğitim ve ÖğretimSakarya ÜniversitesiTürkçe ve Sosyal Bilimler Eğitimi Ana Bilim Dalı
DR. ÖĞR. ÜYESİ HÜLYA ÇELİK
- Sosyal medyadaki haberlere yönelik şüphecilik
Başlık çevirisi yok
AYHAN YAVUZ
Yüksek Lisans
Türkçe
2023
İşletmeAlanya Alaaddin Keykubat Üniversitesiİşletme Mühendisliği Ana Bilim Dalı
DOÇ. DR. MEHMET ÖZER DEMİR
- Sosyal medya ve çeviri: Sosyal medyadaki aktivistlerin çeviriyi kullanma biçimleri
Social media and translation: The ways social media activists use translation
SEDANUR BAYRAKTAR
Yüksek Lisans
Türkçe
2022
Mütercim-TercümanlıkSakarya ÜniversitesiÇeviribilim Ana Bilim Dalı
DR. ÖĞR. ÜYESİ MUHAMMED ZAHİT CAN
- Lise öğrencilerinin sosyal medyadaki bilginin doğruluğuna yönelik karar süreçlerinin incelenmesi
Investigation of high school students' decision processes regarding the accuracy of information on social media
SUZAN AYGÜN
Yüksek Lisans
Türkçe
2024
Eğitim ve ÖğretimTokat Gaziosmanpaşa ÜniversitesiBilgisayar ve Öğretim Teknolojileri Eğitimi Ana Bilim Dalı
DOÇ. DR. KEREM KILIÇER
- Arapçaya çevrilmiş Türk dizilerinin Arap sosyal medyasına yansımaları ve dizilerin, Arap sosyal medya kullanıcılarının Türkçe öğrenmelerine olası katkıları üzerine bir inceleme
A study on the reflections of Turkish series translated into Arabic on Arab social media and the possible contribution of series to Arab social media users' learning Turkish
YÜCEL YILDIZ
Yüksek Lisans
Türkçe
2024
DinBilecik Şeyh Edebali ÜniversitesiTemel İslam Bilimleri Ana Bilim Dalı
DOÇ. DR. ADNAN ARSLAN