Geri Dön

Turkish clickbait detection in social media via machine learning algorithms

Makine öğrenmesi algoritmaları ile sosyal medyada Türkçe clickbait tespiti

  1. Tez No: 684892
  2. Yazar: ŞURA GENÇ
  3. Danışmanlar: DR. ÖĞR. ÜYESİ ELİF SÜRER, DR. ÖĞR. ÜYESİ MURAT PERİT ÇAKIR
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilim ve Teknoloji, Dilbilim, Psikoloji, Science and Technology, Linguistics, Psychology
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2021
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Enformatik Enstitüsü
  11. Ana Bilim Dalı: Bilişsel Bilim Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 99

Özet

Çoğunlukla başlıklarda ve tanıtım mesajlarında kullanılan clickbait (tık tuzağı) stratejisi, metinle ilgili özelliklere sahip bazı merak uyandırıcı ifadeleri kullanarak insanların dikkatini çekmeyi ve onların bağlantıya tıklamalarını sağlamayı amaçlamaktadır. Son yıllarda özellikle sosyal medyada oldukça yaygın hale gelen tık tuzağı, bilgi akışı açısından büyük bir sorun teşkil etmektedir. Clickbait başlıkta vaat edilen bilgiler genellikle ana metinde yer almadığından, clickbait başlıklar okuyucuları hayal kırıklığına uğratmaktadır ve gazetecilik etiği açısından sorunludur. Bu tezde, Twitter'dan alınan Türk haber kaynaklarının manşetlerini de içeren 48.060 örnek ile bir Türkçe veri seti –ClickbaitTR– oluşturulmuş ve veri seti açık kaynak olarak paylaşılmıştır. Clickbait haber başlıklarının tespit edilmesi için bu veri seti üzerinde Yapay Sinir Ağları, Lojistik Regresyon, Rastgele Orman, Uzun-Kısa Süreli Bellek Ağı, Çift Yönlü Uzun-Kısa Süreli Bellek ve Topluluk Öğrenmesi gibi çeşitli makine öğrenmesi algoritmaları uygulanmıştır. Sonuçlar %97 doğruluk oranına sahip olan Çift Yönlü Uzun-Kısa Süreli Bellek algoritmasının clickbait başlıkları tespit etmede en iyi performansa sahip olduğunu ve ardından %93 doğrulukla Uzun-Kısa Süreli Bellek, Yapay Sinir Ağları ve Topluluk Öğrenmesi algoritmalarının geldiğini göstermektedir. Bu tezde başarılı bir clickbait tespiti performansının yanı sıra, clickbait cümlelerin merak ve ilgi gibi psikolojik mekanizmalarına odaklanılarak dilbilimsel ve psikolojik analizi sunulmuştur. Bu tez, en büyük clickbait veri seti ve Türkçe'deki en iyi clickbait tespiti performansı ile clickbait tespiti çalışmalarına katkıda bulunmaktadır.

Özet (Çeviri)

Clickbait strategy, mostly used in headlines and teaser messages, aims to attract people's attention, and make them click on the link by using intriguing expressions with various text-related features. Clickbait, which has become very common especially in social media in recent years, is a major problem for the flow of information. Since the information promised in the clickbait headline is generally not included in the main text, clickbait headlines disappoint readers and is problematic for ethics of journalism. In this thesis, we constructed a Turkish dataset –ClickbaitTR– with 48,060 samples, including headlines of Turkish news sources extracted from Twitter, and made it publicly available. Various machine learning algorithms such as Artificial Neural Network (ANN), Logistic Regression (LR), Random Forest (RF), Long Short-Term Memory Network (LSTM), Bidirectional Long Short-Term Memory (BiLSTM), and Ensemble Classifier (EC) were applied on the dataset for detecting the clickbait headlines. The results show that the BiLSTM has the best performance in detecting clickbait headlines with 97% accuracy followed by the LSTM, the ANN, and the Ensemble Classifier with 93% accuracy. In addition to a successful clickbait detection performance, in this thesis, linguistic and psychological analysis of clickbait sentences were presented with a focus on psychological mechanisms such as curiosity and interest. This thesis contributes to clickbait detection studies with the largest clickbait dataset and best clickbait detection performance in Turkish.

Benzer Tezler

  1. Türkçe haber metinlerinin yaklaşık en yakın komşu arama yöntemi ile benzerlik tespiti

    Similarity detection of turkish news articles with approximate nearest neighbor search

    HAKAN TORUN

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKocaeli Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ALPASLAN BURAK İNNER

  2. Haber siteleri ve sosyal medya sayfalarındaki tıklama tuzağının belirlenmesi

    Determining the clickbait in news sites and social media pages

    AYŞE GEÇKİL

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. MEHMET KAYA

  3. Clickbait haberlere yönelik okur tutumları: Selçuk Üniversitesi örneği

    Readers attitudes towards clickbait news: Selçuk University example

    MALİKE ORMANCI

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Radyo-TelevizyonSelçuk Üniversitesi

    Radyo Televizyon ve Sinema Ana Bilim Dalı

    DOÇ. DR. METE KAZAZ

  4. İnternet gazeteciliğinde tık tuzaklı haberlerin incelenmesi: Ensonhaber.com örneği

    Examining of clickbaite news in internet journalism: Ensonhaber.com example

    SEGAH YEŞİLYURT

    Doktora

    Türkçe

    Türkçe

    2024

    GazetecilikAnadolu Üniversitesi

    Basın ve Yayın Ana Bilim Dalı

    PROF. DR. FİLİZ TİRYAKİOĞLU

  5. İletişim psikolojisi açısından internet haberciliğinde tık yemi (Clıckbaıt) kullanımı

    Use of clickbait in online journalism in terms of communication psycholog

    PELİNSU ÇATALKAYA

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    GazetecilikAnkara Hacı Bayram Veli Üniversitesi

    Gazetecilik Ana Bilim Dalı

    PROF. DR. ZÜLFİKAR DAMLAPINAR