Bilimsel makaleler üzerinde çıkarımsal metin özetleme yaklaşımlarını ve algoritmalarını analiz etmek ve karşılaştırmak için çok ölçütlü bir model
A multi-metric model for analyzing and comparing extractive text summarization approaches and algorithms on scientific papers
- Tez No: 898456
- Danışmanlar: DR. ÖĞR. ÜYESİ SOYDAN SERTTAŞ
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: Türkçe
- Üniversite: Kütahya Dumlupınar Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Yazılımı Bilim Dalı
- Sayfa Sayısı: 64
Özet
Günümüz dünyasında, veri ve bilgi hızla artarken, metin özetleme ve teknolojileri, büyük miktardaki metin verilerini daha erişilebilir ve anlamlı hale getirmede kritik bir rol oynamaktadır. İş dünyasından haber endüstrisine, akademik araştırmalardan diğer birçok alana kadar metin özetleme, hızlı kararlar alınmasına, bilgilere daha hızlı erişilmesine ve kaynakların daha etkin bir şekilde yönetilmesine yardımcı olmaktadır. Ayrıca, bu teknolojileri geliştirmek ve metinlerin daha iyi özetlenmesini sağlamak amacıyla yeni yöntemler ve algoritmalar geliştirmek için metin özetleme alanında araştırmalar devam etmektedir. Bu nedenle, metin özetleme ve bu alandaki araştırmalar, bilgi çağında büyük bir öneme sahiptir. Bu çalışmada, metin özetleme için yeni bir işletim modeli önerilmiş ve değerlendirilmiştir. 16 özetleme algoritması, altı farklı yaklaşımı kapsayacak şekilde uygulanmış ve 50 farklı makale veri kümesi üzerinde test edilmiştir. Üretilen özetlerin, orijinal özetlerle benzerliğini değerlendirmek için dört değerlendirme metriği (BLEU, Rouge-N, Rouge-L, METEOR) kullanılmıştır. Her yaklaşımın algoritmalarının performansı bu metrik sonuçlarına göre değerlendirilmiş ve en iyi performans gösteren algoritma referans algoritma olarak seçilmiştir. Bu referans algoritma, özetlenen metin içindeki konuları ve anahtar kelimeleri belirlemek için LDA yöntemiyle daha fazla analize tabi tutulmuştur. Önerilen model, veri kümeleri ve değerlendirme metrikleri arasında özetleme algoritmalarını geliştirmek ve kapsamlı bir şekilde test etmek için standartlaştırılmış bir iş akışı sunarak, en uygun özetleme yaklaşımını belirlemekte yardımcı olur. Bu çalışma, modelin çeşitli algoritma ve metin kaynakları üzerindeki etkinliğini göstermektedir.
Özet (Çeviri)
In today's world, where data and information are increasingly proliferating, text summarization and technologies play a critical role in making large amounts of text data more accessible and meaningful. In business, the news industry, academic research, and many other fields, text summarization helps make quick decisions, access information faster, and manage resources more effectively. Additionally, text summarization research is conducted to further improve these technologies and develop new methods and algorithms to provide better summarization of texts. Therefore, text summarization and research in this field are of great importance in the information age. In this study, a new operating model for text summarization that can be applied to different algorithms is proposed and evaluated. Sixteen summarization algorithms covering six approaches (statistical, graph-based, content-based, pointer-based, position-based, and user-oriented) were implemented and tested on 50 different full-text article datasets. Four evaluation criteria (BLEU, Rouge-N, Rouge-L, METEOR) were used to assess the similarity between the generated summaries and the original summaries. The performance of the algorithms within each approach was averaged and the overall best-performing algorithm was selected. This best algorithm was subjected to further analysis through Topic Modelling and Keyword Extraction to identify key topics and keywords within the summarised text. The proposed model provides a standardized workflow for developing and thoroughly testing summarization algorithms across datasets and evaluation metrics to determine the most appropriate summarization approach. This study demonstrates the effectiveness of the model on a variety of algorithm types and text sources.
Benzer Tezler
- Derin öğrenme yöntemleri ile otomatik metin özetleme
Automatic text summarization with deep learning
NAZAN KEMALOĞLU ALAGÖZ
Doktora
Türkçe
2022
Mühendislik BilimleriSüleyman Demirel ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. ECİR UĞUR KÜÇÜKSİLLE
- Sağlık bilimleri araştırmalarında kullanılan istatistiksel yöntemlerin metin madenciliği ile incelenmesi
Investigation of statistical methods used in health sciences research using text mining
ÖZEN TAŞTAN
Yüksek Lisans
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesiİstatistik Ana Bilim Dalı
PROF. DR. BÜLENT ÇELİK
- Türkçe bilimsel yayınlar üzerinde birkaç atış ve transfer öğrenme yöntemlerinin değerlendirilmesi
Evaluation of few shot and transfer learning methods on Turkish scientific publications
ÖZGE NUR ÖZARAS
Yüksek Lisans
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAtatürk ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ GÜLŞAH TÜMÜKLÜ ÖZYER
- A rule-based human reliability assessment to enhance shipauxiliary machinery maintenance operations
Gemi yardımcı makineleri bakım onarım operasyonlarınıniyileştirilmesi için kural tabanlı insan güvenilirliği ölçümü
ÇAĞATAY KANDEMİR
Doktora
İngilizce
2020
Denizcilikİstanbul Teknik ÜniversitesiDeniz Ulaştırma Mühendisliği Ana Bilim Dalı
PROF. DR. METİN ÇELİK
- Eğitim yönetiminin ontolojik ve epistemolojik temellerinin üretilen ve tüketilen kavramlar üzerinden incelenmesi
Exploring the ontological and epistemological foundations of educational administration through produced and consumed concepts
OYA USLU ÇETİN
Doktora
Türkçe
2022
Eğitim ve ÖğretimHacettepe ÜniversitesiEğitim Bilimleri Ana Bilim Dalı
PROF. DR. MURAT ÖZDEMİR