Geri Dön

Denetimli makine öğrenmesi algoritmaları ile Türkçe sahte haber tespiti için bir karar destek sistemi

A decision support system for fake news detection in Turkish language with supervised machine learning algorithms

  1. Tez No: 808774
  2. Yazar: YASİN ERDURAN
  3. Danışmanlar: PROF. DR. CEVRİYE GENCER
  4. Tez Türü: Yüksek Lisans
  5. Konular: Yönetim Bilişim Sistemleri, Management Information Systems
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: Türkçe
  9. Üniversite: Gazi Üniversitesi
  10. Enstitü: Bilişim Enstitüsü
  11. Ana Bilim Dalı: Yönetim Bilişim Sistemleri Ana Bilim Dalı
  12. Bilim Dalı: Yönetim Bilişim Sistemleri Bilim Dalı
  13. Sayfa Sayısı: 106

Özet

Sosyal medya ve çevrim içi platformlar aracılığı ile her geçen gün daha fazla habere çok daha hızlı ulaşmaktayız. Bu haberlerin birçoğu bizim için önemli ve faydalı bilgiler içerirken, içlerinden bazı haberler bireye ve topluma zarar verme amacı ile yayılmaktadır. Bu haberler gerçekle hiçbir bağı olmayan, bir kişi ya da kurumun itibarını zedelemeyi, bir ideolojiyi desteklemeyi, kar sağlamayı ve en tehlikelisi alıcısının fikir ve düşüncelerini manipüle etmeyi amaçlayan sahte haberlerdir. Özellikle toplumun bilgi ihtiyacının yüksek olduğu doğal afet, seçim ya da kriz dönemlerinde sosyal medya üzerinden sahte haber yayılımı artmaktadır. Ortaya çıkan enformasyon insan gücüyle teyit edilebilecek boyutları geçmekte ve sahte haberin ortaya çıkardığı hasar büyümektedir. Sahte haberlerin doğuracağı zararların minimize edilmesi için bilgisayar bilim dalı olan makine öğrenmesi algoritmaları kullanılabilmektedir. Makine Öğrenmesi, verilerden öğrenebilen, deneyimlerden bilgi edinebilen ve zaman içinde öğrenme davranışlarını iyileştirebilen algoritmalardır. Çalışmada, doğrudan teyit uzmanları aracılığı ile sahte ve gerçek olarak etiketlenmiş Türkçe haber veri seti oluşturulmuş; bu haberler BoW, TF-IDF ve Doc2Vec özellik çıkarım algoritmaları ile öznitelik vektörlerine dönüştürülmüş; MLP, DT, SVM ve LGR makine öğrenme algoritmaları bu öznitelik vektörleri ile eğitilerek, ortaya çıkan 12 farklı modelin doğrulukları Test/Eğitim ayrımı ve K-fold yöntemleri ile denetlenmiştir. Denemeler için 8 çekirdek işlemcili, 16 GB bellekli bir bilgisayar kullanılmış olup, Python programa dili ile kodlanmış ve makine öğrenmesi modelleri için SciKitLearn kütüphanesi kullanılmıştır, en iyi sonuç TF-IDF özellik çıkartımı vektörleri ile beslenen LGR modeli olduğu tespit edilmiştir. Test/Eğitim ayrımı ile elde edilen sonuçların geçerliliği K-fold doğrulama yöntemi ile test edilmiştir. En iyi sonuç veren TF-IDF özellik çıkarımı algoritmasının vektörleri ile beslenen LGR makine öğrenmesi modeli ve diğer elde edilen modeller ile Türkçe sahte haber tespitine yönelik web tabanlı karar destek sistemi oluşturulmuştur.

Özet (Çeviri)

The number of news is increasing day by day through social media and online platforms. While some of this news is beneficial and true, other news is destructive and fake. Fake news having no connection with reality, aims to damage the reputation of a person or institution, to support an ideology, to make profit and most dangerously to manipulate the ideas and thoughts of receivers. Fake news spreads more widely on social media during natural disasters, elections, and other times of crisis when there is a great need for knowledge in society. Truth of news cannot be verified by human power because of exponential growth of news, therefore the damage caused by fake news is expanding. Machine learning algorithms, a branch of computer science, can be used to minimize the damage caused by fake news. Machine Learning is algorithms that can learn from data, learn from experience, and improve learning behaviors over time. In the study, a Turkish news data set labeled as fake and real was created by direct factcheckers; these articles were converted into feature vectors with BoW, TF-IDF and Doc2Vec feature extraction algorithms; MLP, DT, SVM and LGR machine learning algorithms were trained with these feature vectors, and the accuracy of 12 different models were checked with Test/Training separation and K-fold methods. A computer with 8 core processors and 16 GB memory was used for the experiments, coded in Python programming language and SciKitLearn library was used for machine learning models, the best result was LGR fed with TF-IDF feature extraction vectors in Test/Training separation and K-fold validation method. A decision support system was developed for the study. In this decision support system, TF-IDF and LGR, which are the most successful models, were used. In addition to this model, other models were presented to the decision maker's preference on the decision support system.

Benzer Tezler

  1. İş ve Sosyal Güvenlik Hukuku bakımından dijital platform çalışanlarının hukuki statüsü

    Legal status of digital platform workers in terms of Labour and Social Security Law

    HAZAL TOLU YILMAZ

    Doktora

    Türkçe

    Türkçe

    2022

    HukukGalatasaray Üniversitesi

    Özel Hukuk Ana Bilim Dalı

    PROF. DR. ENVER MURAT ENGİN

  2. Alçak yoğunluklu polietilen ürün kalitesinin makine öğrenmesi algoritmaları ile gerçek zamanlı tahmini

    Real-time estimation of low-density polyethylene product quality with machine learning algorithms

    TOGHRUL KARIMLI

    Yüksek Lisans

    Türkçe

    Türkçe

    2020

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMuğla Sıtkı Koçman Üniversitesi

    Bilişim Sistemleri Mühendisliği Ana Bilim Dalı

    DOÇ. DR. OSMAN ÖZKARACA

  3. Denetimli öğrenme yöntemleri kullanılarak bir ses olay tespit sisteminin gerçekleştirilmesi

    Realization of a sound event detection system using controlled learning methods

    HAKAN GÜLER

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat Üniversitesi

    Yazılım Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MUSTAFA ULAŞ

  4. Makine öğrenmesi kullanılarak endüstriyel pres makinesi için kestirimci bakım uygulaması

    Predictive maintenance application for industrial press machine using machine learning

    ERKUT YİĞİT

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    Elektrik ve Elektronik MühendisliğiKocaeli Üniversitesi

    Elektrik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. MEHMET ZEKİ BİLGİN

  5. Denetimli makine öğrenmesi yöntemleri ile gebelerde anemi ve anemi ile ilişkili faktörlerin tespiti

    Determination of anemia and anemia related factors in pregnant women with supervised machine learning methods

    RÜVEYDA YILDIRIM

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    BiyoistatistikFırat Üniversitesi

    Biyoistatistik Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MEHMET ONUR KAYA