Metin özetleme yöntemlerinin karşılaştırmalı incelenmesi ve baskın küme tabanlı bir çıkarıcı yaklaşımın geliştirilmesi
A comparative analysis of text summarization methods and the development of a dominating set-based extractive approach
- Tez No: 919092
- Danışmanlar: DR. ÖĞR. ÜYESİ FATİH OKUMUŞ
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Metin Özetleme, Graf, Baskın Küme, Çıkarıcı Özetleme, Soyutlayıcı Özetleme, ROUGE Metrikleri, Text Summarization, Graph, Dominating Set, Extractive Summarization, Abstractive Summarization, ROUGE Metrics
- Yıl: 2025
- Dil: Türkçe
- Üniversite: İnönü Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 87
Özet
Bu tez, metin özetleme alanında extractive (çıkarıcı) ve abstractive (soyutlayıcı) yöntemlerin incelenmesi ve karşılaştırılması üzerine odaklanmaktadır. Çalışmada, metin özetleme yöntemlerinin performanslarını değerlendirmek amacıyla, farklı yapıya sahip iki İngilizce veri seti kullanılmıştır: haber içerikli BBC News Summary ve bilimsel makale içerikli PubMed Summarization. TextRank, LexRank, LSA ve KL gibi çıkarıcı yöntemler ile PEGASUS, BART, T5 ve LED gibi soyutlayıcı modeller üzerinde gerçekleştirilen analizlerde, bu yöntemlerin farklı içerik türlerindeki etkileri çeşitli metrikler kullanılarak karşılaştırılmıştır. Elde edilen sonuçlar, her yöntemin belirli durumlarda farklı avantajlar sunduğunu ortaya koymuştur. Tezin ikinci aşamasında, Dominating Set (Baskın Küme) tabanlı yeni bir çıkarıcı özetleme yöntemi önerilmiş ve bu yöntem detaylı olarak incelenmiştir. Bu yöntem, metinlerdeki gereksiz bilgileri filtrelemeyi ve metnin en anlamlı bölümlerini seçerek daha özlü özetler üretmeyi hedeflemektedir. Önerilen yöntemin performansı ROUGE metrikleriyle değerlendirilmiş ve özellikle haber içerikli veri setlerinde diğer yöntemlere kıyasla üstünlük sağladığı görülmüştür. Yöntemin, metin özetleme sürecinde daha verimli ve anlamlı sonuçlar üretebildiği gözlemlenmiştir. Çalışma, bilgi yoğun veri setleri üzerinde özetleme yöntemlerinin etkinliğini değerlendirmeyi, farklı yaklaşımlar arasında kapsamlı bir karşılaştırma sunmayı ve Dominating Set tabanlı yeni bir yöntemin metin özetleme alanındaki uygulanabilirliğini araştırmayı hedeflemektedir. Bu bağlamda tez, hem teorik hem de uygulamalı boyutlarıyla literatüre katkı sağlamayı amaçlamaktadır.
Özet (Çeviri)
This thesis focuses on the examination and comparison of extractive and abstractive methods in the field of text summarization. To evaluate the performance of text summarization methods, two English datasets with different structures were employed: the news-oriented BBC News Summary and the scientific article-oriented PubMed Summarization. Analyses were conducted on extractive methods such as TextRank, LexRank, LSA, and KL, as well as abstractive models including PEGASUS, BART, T5, and LED, comparing their effectiveness across various content types using diverse evaluation metrics. The results demonstrated that each method offers distinct advantages under specific circumstances. In the second phase of the thesis, a novel extractive summarization method based on Dominating Set theory was proposed and thoroughly analyzed. This method aims to filter out redundant information in texts and select the most meaningful segments, producing more concise summaries. The performance of the proposed method was evaluated using ROUGE metrics, and it was observed to outperform other methods, particularly on news-oriented datasets. The method demonstrated its capability to generate more efficient and meaningful results in text summarization tasks. This study aims to assess the effectiveness of summarization methods on information-rich datasets, provide a comprehensive comparison between different approaches, and explore the applicability of the Dominating Set-based method in the field of text summarization. In this context, the thesis seeks to contribute to the literature both theoretically and practically.
Benzer Tezler
- Fake news classification using machine learning and deep learning approaches
Makine öğrenimi ve derin öğrenme yaklaşımlarını kullanarak sahte haber sınıflandırması
SAJA ABDULHALEEM MAHMOOD AL-OBAIDI
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ TUBA ÇAĞLIKANTAR
- İlkokul dördüncü sınıf Türkçe ve matematik derslerinde okuduğunu anlama üzerine bir durum çalışması
A case study on reading comprehension in primary school fourth-grade Turkish and mathematics courses
ÜLKÜ ÇOBAN SURAL
Doktora
Türkçe
2024
Eğitim ve ÖğretimGazi ÜniversitesiTemel Eğitim Ana Bilim Dalı
PROF. DR. NACİYE AKSOY
- Makine öğrenmesi kullanarak metin özetleme
Text summarization using machine learning
GÜLNİHAL UYKUN
Yüksek Lisans
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSüleyman Demirel ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. ARİF KOYUN
- Evaluation of vector and graph-based search methods in a banking knowledge platform using advanced language models
Bankacılık bilgi platformu için vektör ve grafik temelli arama yöntemlerinin gelişmiş dil modelleriyle değerlendirilmesi
BÜNYAMİN BAKIR
Yüksek Lisans
İngilizce
2025
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiBüyük Veri ve İş Analitiği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ SÜHA TUNA
- A faithfulness-aware pretraining strategy for abstractive text summarization
Soyutlayıcı metin özetleme için sadakat-farkında bir ön eğitim stratejisi
MOHANAD ALREFAAI
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya ÜniversitesiBilgisayar ve Bilişim Mühendisliği Ana Bilim Dalı
PROF. DR. DEVRİM AKGÜN