Turkish clickbait detection in social media via machine learning algorithms
Makine öğrenmesi algoritmaları ile sosyal medyada Türkçe clickbait tespiti
- Tez No: 684892
- Danışmanlar: DR. ÖĞR. ÜYESİ ELİF SÜRER, DR. ÖĞR. ÜYESİ MURAT PERİT ÇAKIR
- Tez Türü: Yüksek Lisans
- Konular: Bilim ve Teknoloji, Dilbilim, Psikoloji, Science and Technology, Linguistics, Psychology
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2021
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Enformatik Enstitüsü
- Ana Bilim Dalı: Bilişsel Bilim Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 99
Özet
Çoğunlukla başlıklarda ve tanıtım mesajlarında kullanılan clickbait (tık tuzağı) stratejisi, metinle ilgili özelliklere sahip bazı merak uyandırıcı ifadeleri kullanarak insanların dikkatini çekmeyi ve onların bağlantıya tıklamalarını sağlamayı amaçlamaktadır. Son yıllarda özellikle sosyal medyada oldukça yaygın hale gelen tık tuzağı, bilgi akışı açısından büyük bir sorun teşkil etmektedir. Clickbait başlıkta vaat edilen bilgiler genellikle ana metinde yer almadığından, clickbait başlıklar okuyucuları hayal kırıklığına uğratmaktadır ve gazetecilik etiği açısından sorunludur. Bu tezde, Twitter'dan alınan Türk haber kaynaklarının manşetlerini de içeren 48.060 örnek ile bir Türkçe veri seti –ClickbaitTR– oluşturulmuş ve veri seti açık kaynak olarak paylaşılmıştır. Clickbait haber başlıklarının tespit edilmesi için bu veri seti üzerinde Yapay Sinir Ağları, Lojistik Regresyon, Rastgele Orman, Uzun-Kısa Süreli Bellek Ağı, Çift Yönlü Uzun-Kısa Süreli Bellek ve Topluluk Öğrenmesi gibi çeşitli makine öğrenmesi algoritmaları uygulanmıştır. Sonuçlar %97 doğruluk oranına sahip olan Çift Yönlü Uzun-Kısa Süreli Bellek algoritmasının clickbait başlıkları tespit etmede en iyi performansa sahip olduğunu ve ardından %93 doğrulukla Uzun-Kısa Süreli Bellek, Yapay Sinir Ağları ve Topluluk Öğrenmesi algoritmalarının geldiğini göstermektedir. Bu tezde başarılı bir clickbait tespiti performansının yanı sıra, clickbait cümlelerin merak ve ilgi gibi psikolojik mekanizmalarına odaklanılarak dilbilimsel ve psikolojik analizi sunulmuştur. Bu tez, en büyük clickbait veri seti ve Türkçe'deki en iyi clickbait tespiti performansı ile clickbait tespiti çalışmalarına katkıda bulunmaktadır.
Özet (Çeviri)
Clickbait strategy, mostly used in headlines and teaser messages, aims to attract people's attention, and make them click on the link by using intriguing expressions with various text-related features. Clickbait, which has become very common especially in social media in recent years, is a major problem for the flow of information. Since the information promised in the clickbait headline is generally not included in the main text, clickbait headlines disappoint readers and is problematic for ethics of journalism. In this thesis, we constructed a Turkish dataset –ClickbaitTR– with 48,060 samples, including headlines of Turkish news sources extracted from Twitter, and made it publicly available. Various machine learning algorithms such as Artificial Neural Network (ANN), Logistic Regression (LR), Random Forest (RF), Long Short-Term Memory Network (LSTM), Bidirectional Long Short-Term Memory (BiLSTM), and Ensemble Classifier (EC) were applied on the dataset for detecting the clickbait headlines. The results show that the BiLSTM has the best performance in detecting clickbait headlines with 97% accuracy followed by the LSTM, the ANN, and the Ensemble Classifier with 93% accuracy. In addition to a successful clickbait detection performance, in this thesis, linguistic and psychological analysis of clickbait sentences were presented with a focus on psychological mechanisms such as curiosity and interest. This thesis contributes to clickbait detection studies with the largest clickbait dataset and best clickbait detection performance in Turkish.
Benzer Tezler
- Türkçe haber metinlerinin yaklaşık en yakın komşu arama yöntemi ile benzerlik tespiti
Similarity detection of turkish news articles with approximate nearest neighbor search
HAKAN TORUN
Yüksek Lisans
Türkçe
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKocaeli ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ALPASLAN BURAK İNNER
- Haber siteleri ve sosyal medya sayfalarındaki tıklama tuzağının belirlenmesi
Determining the clickbait in news sites and social media pages
AYŞE GEÇKİL
Yüksek Lisans
Türkçe
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. MEHMET KAYA
- Clickbait haberlere yönelik okur tutumları: Selçuk Üniversitesi örneği
Readers attitudes towards clickbait news: Selçuk University example
MALİKE ORMANCI
Yüksek Lisans
Türkçe
2019
Radyo-TelevizyonSelçuk ÜniversitesiRadyo Televizyon ve Sinema Ana Bilim Dalı
DOÇ. DR. METE KAZAZ
- İnternet gazeteciliğinde tık tuzaklı haberlerin incelenmesi: Ensonhaber.com örneği
Examining of clickbaite news in internet journalism: Ensonhaber.com example
SEGAH YEŞİLYURT
Doktora
Türkçe
2024
GazetecilikAnadolu ÜniversitesiBasın ve Yayın Ana Bilim Dalı
PROF. DR. FİLİZ TİRYAKİOĞLU
- İletişim psikolojisi açısından internet haberciliğinde tık yemi (Clıckbaıt) kullanımı
Use of clickbait in online journalism in terms of communication psycholog
PELİNSU ÇATALKAYA
Yüksek Lisans
Türkçe
2024
GazetecilikAnkara Hacı Bayram Veli ÜniversitesiGazetecilik Ana Bilim Dalı
PROF. DR. ZÜLFİKAR DAMLAPINAR