Geri Dön

Türkçe haber metinlerinin yaklaşık en yakın komşu arama yöntemi ile benzerlik tespiti

Similarity detection of turkish news articles with approximate nearest neighbor search

  1. Tez No: 744331
  2. Yazar: HAKAN TORUN
  3. Danışmanlar: DR. ÖĞR. ÜYESİ ALPASLAN BURAK İNNER
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: Türkçe
  9. Üniversite: Kocaeli Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 79

Özet

İnternet haberciliğinin yaygınlaşması ile birlikte geleneksel medya organları büyük bir dönüşüm geçirmektedir. Çevrimiçi ve çevrimdışı platformlarda yayınlanan haberler çoğunlukla konusu dışında içerikler barındırmaktadır. Aynı zamanda internet üzerinde yayınlanan haberler genellikle benzer içeriklerle farklı kaynaklar tarafından yayınlanmakta ve okuyucuların haberin içeriğine hızlı bir şekilde ulaşması zorlaşmaktadır. Haber sitelerinin daha fazla kullanıcı tarafından ziyaret edilmesi amacıyla tıklama tuzağı (clickbait) başlıklar kullanılmakta ve ziyaretçilerin gazetecilikte 5N1K kuralı olarak adlandırılan; ne, ne zaman, nerede, nasıl ve kim gibi haber öğelerine ulaşması zorlaşmaktadır. Bu çalışmada Türkçe yayın yapan 5 farklı haber kaynağından 350.000 Türkçe haber geliştirilen bir web kazıyıcı (scraper) aracılığıyla toplanmış ve özetlenmiştir. Bu haberler içerisinden 2022 Ocak ayında yayınlanmış toplam 28.000 haber kullanılarak eğitim verisi oluşturulmuştur. Ham haber metinleri ve özet haber metinleri kullanılarak haber vektörleri oluşturulup, haber vektörleri arasında yaklaşık en yakın komşu araması yapılarak farklı kaynaklardan yayınlanan benzer haberlerin tespit edilmesi için bir yöntem geliştirilmiştir. Sistemin başarısının ölçülmesi için web tabanlı bir oylayıcı sistem geliştirilmiş ve uzmanlar tarafından değerlendirilmiştir. Uzman oylaması sonucunda vektörleştirme yöntemlerinin başarısı ve özetlemenin başarı üzerine etkisi karşılaştırılarak performans değerlendirmesi yapılmıştır.

Özet (Çeviri)

With the spread of internet journalism, traditional media organs are undergoing a huge transformation. The news published on online and offline platforms mostly contain different content other than their subjects. News articles on the internet are generally published by different sources with similar content and it is difficult to reach the content of the news quickly for the visitors. Clickbait headlines are used to be visited by more users. It becomes harder for visitors to reach the basic elements of journalism, such as what, when, where, how and who. In this study, 350.000 news which were published from 5 different news sources in Turkish were collected through a web scraper developed by us and summarized. Training data was created by using 28.000 news published in January 2022 from these news. A method has been developed to detect similar news articles from different sources by creating news vectors using raw and summarized news articles, and approximate nearest neighbors searching among news vectors. To measure the success of the system, a web-based voting system has been developed and evaluated by experts. As a result of expert voting, the success of vectorization methods and the effect of summarization on success were compared and performance was evaluated.

Benzer Tezler

  1. Üretken rakip ağlar ile Türkçe metin üretimi

    Turkish text generation with generative adversarial networks

    BARIŞ GÜCÜK

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKarabük Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ RAFET DURGUT

  2. 7 haziran 2015 genel seçimi ve 1 kasım 2015 erken genel seçiminde siyasi parti liderlerinin gazetelerde temsili

    The representation of the political party leaders in the newspapers at the june 7 2015 general election and november 1 2015 the early general election

    RAMAZAN ÖZDEN

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    GazetecilikGazi Üniversitesi

    Radyo Televizyon ve Sinema Ana Bilim Dalı

    PROF. DR. GÜLCAN SEÇKİN

  3. Yazma eğitiminde basın dilinden yararlanma

    Using press language in writing education

    SEVTAP BUZLUKLUOĞLU ARSLAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2016

    Eğitim ve ÖğretimGaziosmanpaşa Üniversitesi

    Eğitim Bilimleri Ana Bilim Dalı

    YRD. DOÇ. DR. SAMİ BASKIN

  4. Haber metinlerinin söylemsel analizi üzerine bir çalışma: Haberin tarafsızlığı açısından Türk basınında temizlik işçileri grevi

    Başlık çevirisi yok

    AYTÜL GÜRTAŞ

    Yüksek Lisans

    Türkçe

    Türkçe

    1994

    GazetecilikGazi Üniversitesi

    Gazetecilik Ana Bilim Dalı

    YRD. DOÇ. DR. NURETTİN GÜZ

  5. Critical discourse analysis of Turkish newspapers published in english

    İngilizce olarak yayınlanan Türk gazetelerinin eleştirel söylem çözümlemesi

    SERAP DURMUŞ

    Yüksek Lisans

    İngilizce

    İngilizce

    2015

    GazetecilikAtılım Üniversitesi

    Mütercim Tercümanlık Ana Bilim Dalı

    YRD. DOÇ. DR. ÖZLEM ŞAHİN SOY