Kural tabanlı yöntemler kullanılarak otomatik metin özetleme sistemi
Automatic text summarization system using rule-based methods
- Tez No: 917315
- Danışmanlar: DOÇ. DR. FATİH BALAMAN
- Tez Türü: Doktora
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2025
- Dil: Türkçe
- Üniversite: Hatay Mustafa Kemal Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Enformatik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 94
Özet
Teknoloji, günümüz insanın vazgeçilmez bir parçası olmakla birlikte günlük hayatımızı kolaylaştırmaya hızla devam etmektedir. Bu kolaylıklardan bir tanesi de dijital dünyada ve internet mecralarında karşılaşılan yoğun metinsel verilerin hızlı ve etkili bir şekilde analiz edilerek insan müdahalesi olmadan bilgisayar ortamında otomatik bir şekilde özetlenmesidir. Bu çalışmada, dünyanın en büyük dijital kütüphanesi olan Wikipedia'dan elde edilen 8 ana kategoriye ait 32 adet metin veri seti olarak kullanılmıştır. Veri seti aralarında öğretmen, akademisyen ve mühendislerden oluşan 12 adet özetleyici tarafından tez kapsamında geliştirilen web tabanlı bir uygulama aracılığı ile manuel olarak özetlenmiştir. Çıkarılan özetlerin öncelikle birbirleri ile olan benzerlikleri kontrol edilerek manuel özetlerin tutarlı ve titizlikle yapıldığı tespit edilmiştir. Çıkarılan manuel özetlerden otomatik metin özetlemede bir özet metnin özet uzunluk oranın ortalama %41,44 olduğu tespit edilmiştir. Ayrıca literatürde çıkarımsal metin özetleme çalışmalarında sıklıkla kullanılan cümle seçim özniteliklerinin önem dereceleri ağırlıklandırılarak yapılacak sonraki çalışmalara katkı sağlanması hedeflenmektedir. Tez çalışması kapsamında elde edilen otomatik metin özetleme özet metin uzunluk oranı ve cümle seçim öznitelik ağırlıkları kullanılarak yapılan otomatik metin özetleme çalışmasında yüksek başarı değerleri elde edilmiştir. Çalışma kapsamında geliştirilen algoritmanın performansı ROUGE başarı metriği tarafından değerlendirilerek %73 başarı elde etmiştir. Deneysel çalışmanın sonucunda özet metin uzunluk oranı ve özniteliklerin ağırlıklandırılması önerilen modelin otomatik metin özetleme performansını olumlu yönde etkileyerek başarılı sonuçlar verdiği gözlemlenmiştir.
Özet (Çeviri)
Technology has become an indispensable part of modern human life and continues to rapidly simplify our daily routines. One of these conveniences is the ability to analyze large amounts of textual data encountered in the digital world and online platforms quickly and effectively, summarizing it automatically in a computer environment without human intervention. In this study, 32 text datasets belonging to 8 main categories were used, sourced from Wikipedia, the world's largest digital library. These datasets were manually summarized by 12 individuals, including teachers, academics, and engineers, using a web-based application developed as part of the thesis. The consistency and meticulousness of the manual summaries were verified by analyzing the similarities between the summaries. From the manual summaries, it was determined that the average summary length ratio for a summarized text in automatic text summarization was approximately 41.44%. Additionally, it is aimed to contribute to future studies by weighting the importance of sentence selection features, which are frequently used in extractive text summarization research in the literature. Using the summary length ratio and sentence selection feature weights obtained during the thesis study, the automatic text summarization achieved high success rates. The performance of the algorithm developed within the scope of this study was evaluated using the ROUGE success metric, achieving a success rate of 73%. The experimental results demonstrated that the proposed model's summary length ratio and feature weighting positively impacted the automatic text summarization performance, yielding successful outcomes.
Benzer Tezler
- Rule-based text summarization in Turkish
Türkçe için kural tabanlı metin özetleme
ÇAĞDAŞ CAN BİRANT
Doktora
İngilizce
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolDokuz Eylül ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. YALÇIN ÇEBİ
- Paraphrase identification in turkish using distributed representations of words and sentences
Dağıtık kelime ve cümle temsilleri kullanılarak türkçe eşanlatım tespiti
HAKKI ENGİN YORGANCIOĞLU
Yüksek Lisans
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEge ÜniversitesiUluslararası Bilgisayar Ana Bilim Dalı
PROF. DR. BAHAR KARAOĞLAN
- Türkçe metinlerde duygu analizi
Sentiment analysis in Turkish texts
CUMALİ TÜRKMENOĞLU
Yüksek Lisans
Türkçe
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. AHMET CÜNEYD TANTUĞ
- Sarcasm detection in text using deep neural networks
Derin sinir ağları kullanılarak metin içinde alaycılık tespiti
GİZEM GÜMÜŞÇEKİÇCİ
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolIşık ÜniversitesiBilgisayar Ana Bilim Dalı
DR. ÖĞR. ÜYESİ RAHİM DEHKHARGHANİ
- Automatic disambiguation of turkish discourse connectives based on a Turkish connective lexicon
Türkçe söylem bağlaçlarının Türkçe bağlaç sözlüğüne dayalı olarak ayrıştırılması
KEZBAN BAŞIBÜYÜK
Doktora
İngilizce
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. ALİ HİKMET DOĞRU
PROF. DR. DENİZ ZEYREK BOZŞAHİN