Türkçe haber metinlerinin yaklaşık en yakın komşu arama yöntemi ile benzerlik tespiti
Similarity detection of turkish news articles with approximate nearest neighbor search
- Tez No: 744331
- Danışmanlar: DR. ÖĞR. ÜYESİ ALPASLAN BURAK İNNER
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: Türkçe
- Üniversite: Kocaeli Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
- Sayfa Sayısı: 79
Özet
İnternet haberciliğinin yaygınlaşması ile birlikte geleneksel medya organları büyük bir dönüşüm geçirmektedir. Çevrimiçi ve çevrimdışı platformlarda yayınlanan haberler çoğunlukla konusu dışında içerikler barındırmaktadır. Aynı zamanda internet üzerinde yayınlanan haberler genellikle benzer içeriklerle farklı kaynaklar tarafından yayınlanmakta ve okuyucuların haberin içeriğine hızlı bir şekilde ulaşması zorlaşmaktadır. Haber sitelerinin daha fazla kullanıcı tarafından ziyaret edilmesi amacıyla tıklama tuzağı (clickbait) başlıklar kullanılmakta ve ziyaretçilerin gazetecilikte 5N1K kuralı olarak adlandırılan; ne, ne zaman, nerede, nasıl ve kim gibi haber öğelerine ulaşması zorlaşmaktadır. Bu çalışmada Türkçe yayın yapan 5 farklı haber kaynağından 350.000 Türkçe haber geliştirilen bir web kazıyıcı (scraper) aracılığıyla toplanmış ve özetlenmiştir. Bu haberler içerisinden 2022 Ocak ayında yayınlanmış toplam 28.000 haber kullanılarak eğitim verisi oluşturulmuştur. Ham haber metinleri ve özet haber metinleri kullanılarak haber vektörleri oluşturulup, haber vektörleri arasında yaklaşık en yakın komşu araması yapılarak farklı kaynaklardan yayınlanan benzer haberlerin tespit edilmesi için bir yöntem geliştirilmiştir. Sistemin başarısının ölçülmesi için web tabanlı bir oylayıcı sistem geliştirilmiş ve uzmanlar tarafından değerlendirilmiştir. Uzman oylaması sonucunda vektörleştirme yöntemlerinin başarısı ve özetlemenin başarı üzerine etkisi karşılaştırılarak performans değerlendirmesi yapılmıştır.
Özet (Çeviri)
With the spread of internet journalism, traditional media organs are undergoing a huge transformation. The news published on online and offline platforms mostly contain different content other than their subjects. News articles on the internet are generally published by different sources with similar content and it is difficult to reach the content of the news quickly for the visitors. Clickbait headlines are used to be visited by more users. It becomes harder for visitors to reach the basic elements of journalism, such as what, when, where, how and who. In this study, 350.000 news which were published from 5 different news sources in Turkish were collected through a web scraper developed by us and summarized. Training data was created by using 28.000 news published in January 2022 from these news. A method has been developed to detect similar news articles from different sources by creating news vectors using raw and summarized news articles, and approximate nearest neighbors searching among news vectors. To measure the success of the system, a web-based voting system has been developed and evaluated by experts. As a result of expert voting, the success of vectorization methods and the effect of summarization on success were compared and performance was evaluated.
Benzer Tezler
- Üretken rakip ağlar ile Türkçe metin üretimi
Turkish text generation with generative adversarial networks
BARIŞ GÜCÜK
Yüksek Lisans
Türkçe
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKarabük ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ RAFET DURGUT
- 7 haziran 2015 genel seçimi ve 1 kasım 2015 erken genel seçiminde siyasi parti liderlerinin gazetelerde temsili
The representation of the political party leaders in the newspapers at the june 7 2015 general election and november 1 2015 the early general election
RAMAZAN ÖZDEN
Yüksek Lisans
Türkçe
2019
GazetecilikGazi ÜniversitesiRadyo Televizyon ve Sinema Ana Bilim Dalı
PROF. DR. GÜLCAN SEÇKİN
- Yazma eğitiminde basın dilinden yararlanma
Using press language in writing education
SEVTAP BUZLUKLUOĞLU ARSLAN
Yüksek Lisans
Türkçe
2016
Eğitim ve ÖğretimGaziosmanpaşa ÜniversitesiEğitim Bilimleri Ana Bilim Dalı
YRD. DOÇ. DR. SAMİ BASKIN
- Haber metinlerinin söylemsel analizi üzerine bir çalışma: Haberin tarafsızlığı açısından Türk basınında temizlik işçileri grevi
Başlık çevirisi yok
AYTÜL GÜRTAŞ
Yüksek Lisans
Türkçe
1994
GazetecilikGazi ÜniversitesiGazetecilik Ana Bilim Dalı
YRD. DOÇ. DR. NURETTİN GÜZ
- Critical discourse analysis of Turkish newspapers published in english
İngilizce olarak yayınlanan Türk gazetelerinin eleştirel söylem çözümlemesi
SERAP DURMUŞ
Yüksek Lisans
İngilizce
2015
GazetecilikAtılım ÜniversitesiMütercim Tercümanlık Ana Bilim Dalı
YRD. DOÇ. DR. ÖZLEM ŞAHİN SOY