Haber metinlerinin özetlenmesinde graf teorisi ve Malatya merkezilik algoritmasının kullanılması
Using graph theory and Malatya centrality algorithm in summarizing news texts
- Tez No: 928045
- Danışmanlar: DR. ÖĞR. ÜYESİ SELMAN YAKUT
- Tez Türü: Yüksek Lisans
- Konular: Bilim ve Teknoloji, Science and Technology
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2025
- Dil: Türkçe
- Üniversite: İnönü Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Yazılım Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 73
Özet
Bilgiye hızlı ve doğru erişim, dijital çağın en önemli gereksinimlerinden biridir. Bilgi kaynaklarının çoğalmasıyla birlikte kullanıcıların bilgiye kolayca ulaşmasını sağlamak için metin özetleme yöntemlerine duyulan ihtiyaç giderek artmaktadır. Özellikle haber metinleri gibi yoğun bilgi içeren kaynakların etkili bir şekilde özetlenmesi, hem zaman tasarrufu sağlamakta hem de bilginin anlaşılabilirliğini artırmaktadır. Bu çalışmada, haber metinlerinin özetlenmesi için Malatya Merkezilik Algoritması'na dayalı bir yöntem geliştirilmiştir. Algoritma, kelimeler arasındaki ilişkileri graf teorisi çerçevesinde analiz ederek metindeki önemli noktaları belirlemek için merkezilik değerlerini kullanmaktadır. Çalışmada, BBC veri setinden 2000, CNN veri setinden ise 1000 haber metni kullanılarak algoritmanın performansı değerlendirilmiştir. Özetleme işlemi sırasında, metinlerin anlam bütünlüğünü koruyarak en önemli bilgileri seçmek hedeflenmiştir. Algoritmanın başarısı, ROUGE-1, ROUGE-2 ve ROUGE-L metrikleri ile ölçülmüş ve TextRank, PageRank, LexRank ve TF-IDF gibi popüler yöntemlerle karşılaştırılmıştır. Test sonuçları, Malatya Merkezilik Algoritması'nın bilgi kapsamı açısından rekabetçi bir performans sunduğunu ortaya koymuştur. Ancak, özetlerdeki gereksiz kelimelerin varlığı, algoritmanın daha da geliştirilmesi gerektiğine işaret etmektedir. Bu çalışma, önerilen yöntemin haber metinlerinin özetlenmesi için etkili bir yaklaşım sunduğunu ve metin özetleme tekniklerine yeni bir bakış açısı kazandırabileceğini göstermektedir. Gelecekte, algoritmanın farklı veri türleri üzerinde test edilmesi ve daha ileri optimizasyonlarla performansının artırılması hedeflenmektedir. Bu yönüyle, önerilen yöntem, bilgiye hızlı erişim sağlama ve anlamlı özetler oluşturma konusunda önemli bir potansiyele sahiptir.
Özet (Çeviri)
Fast and accurate access to information is one of the most important requirements of the digital age. With the proliferation of information sources, the need for text summarization methods to enable users to easily access information is increasing. Effective summarization of sources containing intensive information, especially news texts, both saves time and increases the understandability of information. In this study, a method based on the Malatya Centrality Algorithm was developed for summarizing news texts. The algorithm analyzes the relationships between words within the framework of graph theory and uses centrality values to determine important points in the text. In the study, the performance of the algorithm was evaluated using 2000 news texts from the BBC dataset and 1000 news texts from the CNN dataset. During the summarization process, the aim was to select the most important information while preserving the semantic integrity of the texts. The success of the algorithm was measured with ROUGE-1, ROUGE-2 and ROUGE-L metrics and compared with popular methods such as TextRank, PageRank, LexRank and TF-IDF. The test results show that the Malatya Centrality Algorithm offers competitive performance in terms of information coverage. However, the presence of unnecessary words in the summaries indicates that the algorithm needs to be further developed. This study shows that the proposed method offers an effective approach for summarizing news texts and can provide a new perspective on text summarization techniques. In the future, it is aimed to test the algorithm on different data types and to increase its performance with further optimizations. In this respect, the proposed method has significant potential in providing fast access to information and creating meaningful summaries.
Benzer Tezler
- Büyük dil modelleri kullanan derin öğrenme tabanlı dinamik çok modlu veri özetleme yaklaşımları
Deep learning based multi modal data summarization approaches using large language models
TURAN GÖKTUĞ ALTUNDOĞAN
Doktora
Türkçe
2025
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. MEHMET KARAKÖSE
- Bilimsel makaleler üzerinde çıkarımsal metin özetleme yaklaşımlarını ve algoritmalarını analiz etmek ve karşılaştırmak için çok ölçütlü bir model
A multi-metric model for analyzing and comparing extractive text summarization approaches and algorithms on scientific papers
MEHMET ALİ DURSUN
Yüksek Lisans
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKütahya Dumlupınar ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ SOYDAN SERTTAŞ
- Haber metinlerinin kategorizasyonunda varlık isimleri ve konu başlıkları ilişkisi
Relationship between the named entities and the subject titles in categorization of news items
İPEK ŞENCAN
Yüksek Lisans
Türkçe
2014
Bilgi ve Belge YönetimiHacettepe ÜniversitesiBilgi ve Belge Yönetimi Ana Bilim Dalı
DOÇ. DR. İREM SOYDAL
- Moglichkeiten zur invarianz bei der übersetzung von nachrichtentexten (Am reispiel von texten der Deutschen welle in Deutscher und in Turkischer sprache ausgestrahlt)
Haber metinlerinin çevirilerinde değişmezlik olanakları (Almanya'nın Sesi Radyosu'nda Almanca ve Türkçe yayınlanan haber metinleri çözümlemesi)
OKTAY SAYDAM
- İnternet haberciliğinde yapay zeka teknolojisi kullanımı: Robot gazetecilik
Usage of artificial intelligence technology on online journalism: Robot journalism
FEYYAZ FIRAT
Yüksek Lisans
Türkçe
2018
GazetecilikGazi ÜniversitesiGazetecilik Ana Bilim Dalı
DOÇ. DR. İBRAHİM HAKAN DÖNMEZ