Fake detection and analysis in tweets with machine learning algorithms

Makine öğrenimi algoritmaları ile tweetlerde sahtelik tespit ve analizi

PDF İndir

Tez No: 920848
Yazar: ŞEHRİNAZ KOCA
Danışmanlar: PROF. DR. İLYAS ÇİÇEKLİ
Tez Türü: Yüksek Lisans
Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
Anahtar Kelimeler: Belirtilmemiş.
Yıl: 2024
Dil: İngilizce
Üniversite: Hacettepe Üniversitesi
Enstitü: Fen Bilimleri Enstitüsü
Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
Sayfa Sayısı: 115

Özet

Sosyal medya uygulama ve kullanımının yaygınlaşması, paylaşımlardaki verilerin gerçek bilgi mi yoksa yanıltıcı bilgi mi içerdiği konusunda endişeleri artırmıştır. Sahtecilik tespit uygulamaları siyasete, felaketlere veya olumsuz olaylara ilişkin sahte Twitter gönderilerini ve sahte haber metinlerini tespit etmek için kullanılmaktadır. Sahtecilik tespit algoritmalarının temeli eğitim kümesi ile eğitilmiş model kullanılarak metni iki sınıfa ayırma işlemidir. Bu tez çalışmasında sahtecilik tespiti için sınıflandırma görevi kapsamında farklı makine öğrenmesi algoritmasını altı farklı veri kümesine uygulayarak performanslarını karşılaştırdık. Bu algoritmaların performans sonuçları veri kümeleri ve algoritmalar açısından detaylı olarak incelenmiştir. Veri kümelerinin bir kısmı İngilizce, bir tanesi ise Türkçe veri kümesinden oluşmaktadır. Veri kümeleri Covid19, siyaset, ekonomi, deprem, kasırga gibi çeşitli alanları ve konuları kapsamaktadır. Metin uzunluğunun etkisini değerlendirmek için hem kısa tweetlerden hem de daha uzun haber metinlerinden oluşan veri kümeleri seçilmiştir. İkinci olarak farklı veri kümelerinin eğitim ve test kümesi olarak kullanılmasının sonuçları incelenmiş ve hangi veri kümelerinin birlikte kullanıldığında iyi sonuçlar verdiği belirlenmiştir. Daha sonra, farklı veri kümelerinin birleştirilmesiyle elde edilen eğitim veri kümesi ile tek bir farklı veri kümesinden oluşan test kümesi kullanıldığında elde edilen sonuçlar analiz edilerek veri kümelerinin benzerlik veya farklılığının sonuçlar üzerindeki etkisi değerlendirilmiştir. Son olarak, geliştirilen model Uzun-Kısa Süreli Bellek (LSTM) algoritmasına dayandırılmış ve LSTM algoritmasında kullanılan katmanlar ve hiperparametreler ile yapılan çalışmalar temel alınarak oluşturulmuştur.

Özet (Çeviri)

The widespread use and application of social media have raised concerns about whether the shared data contains accurate information or is misleading. Fake detection applications are used to detect fake Twitter(X) posts and fake news texts related to politics, catastrophic or bad events. The basis of fake detection algorithms is the process of separating the text into two classes with the model trained with the training set. In this thesis study, we first apply six different machine learning algorithms to six different datasets to compare their performance in the fake detection classification task. The performance results of these algorithms are examined in detail in terms of datasets and algorithms. Some of the datasets are English and one of them Turkish. The datasets cover a variety of fields and topics, including COVID-19, politics, the economy, earthquakes, and hurricanes. To evaluate the impact of text length, datasets containing both short tweets and longer news articles are chosen. Secondly, an analysis is conducted to determine the outcomes of using different datasets as training and testing datasets and to identify which datasets performed well when combined. Afterwards, the effects of the similarity or difference of the datasets on the results are analyzed by examining the results obtained when the train dataset obtained by combining different datasets and the test dataset is one different dataset. Finally, a Long-Short Term Memory (LSTM) model is developed based on studies involving the layers and hyperparameters used in the LSTM algorithm.

Benzer Tezler

Tez No
847173
Fake news classification using machine learning and deep learning approaches
Makine öğrenimi ve derin öğrenme yaklaşımlarını kullanarak sahte haber sınıflandırması
SAJA ABDULHALEEM MAHMOOD AL-OBAIDI
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Gazi Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ TUBA ÇAĞLIKANTAR
Tez No
820613
Analyzing the effects of emotions on fake news detection: A Covid-19 case study
Duyguların sahte haber tespiti üzerindeki etkilerininanalizi: Bir Covıd-19 vaka çalışması
BAHAREH FARHOUDINIA
Doktora
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Sabancı Üniversitesi
Yönetim Bilimleri Bilim Dalı
PROF. DR. NİHAT KASAP
PROF. DR. SELCEN ÖZTÜRKCAN
Tez No
901208
Twitter'da yanlış bilgi ve dezenformasyon tespiti için yapay zeka tekniklerinin kullanılması ve karşılaştırılması
Using and comparison of artificial intelligence techniques to detect misinformation and disinformation on Twitter
OMAR RAAD MAHMOOD MAHMOOD
Yüksek Lisans
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Erzincan Binali Yıldırım Üniversitesi
Yapay Zeka ve Robotik Ana Bilim Dalı
DR. ÖĞR. ÜYESİ FUNDA AKAR
Tez No
835670
Social media based crime prediction using machine learning
Makine öğrenme algoritmasını kullanarak sosyal medya tabanlı suç tahmini
SAKIRIN TAM
Doktora
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Ankara Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
Assoc. Prof. Dr. ÖMER ÖZGÜR TANRIÖVER
Tez No
651275
Türkçe için sahte haber tespit modelinin oluşturulması
A fake news detection model for Turkish language
UĞUR MERTOĞLU
Doktora
Türkçe
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Hacettepe Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ BURKAY GENÇ
PROF. DR. HAYRİ SEVER

Geri Dön