Geri Dön

Kural tabanlı yöntemler kullanılarak otomatik metin özetleme sistemi

Automatic text summarization system using rule-based methods

  1. Tez No: 917315
  2. Yazar: ALİ KÜSMÜŞ
  3. Danışmanlar: DOÇ. DR. FATİH BALAMAN
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2025
  8. Dil: Türkçe
  9. Üniversite: Hatay Mustafa Kemal Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Enformatik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 94

Özet

Teknoloji, günümüz insanın vazgeçilmez bir parçası olmakla birlikte günlük hayatımızı kolaylaştırmaya hızla devam etmektedir. Bu kolaylıklardan bir tanesi de dijital dünyada ve internet mecralarında karşılaşılan yoğun metinsel verilerin hızlı ve etkili bir şekilde analiz edilerek insan müdahalesi olmadan bilgisayar ortamında otomatik bir şekilde özetlenmesidir. Bu çalışmada, dünyanın en büyük dijital kütüphanesi olan Wikipedia'dan elde edilen 8 ana kategoriye ait 32 adet metin veri seti olarak kullanılmıştır. Veri seti aralarında öğretmen, akademisyen ve mühendislerden oluşan 12 adet özetleyici tarafından tez kapsamında geliştirilen web tabanlı bir uygulama aracılığı ile manuel olarak özetlenmiştir. Çıkarılan özetlerin öncelikle birbirleri ile olan benzerlikleri kontrol edilerek manuel özetlerin tutarlı ve titizlikle yapıldığı tespit edilmiştir. Çıkarılan manuel özetlerden otomatik metin özetlemede bir özet metnin özet uzunluk oranın ortalama %41,44 olduğu tespit edilmiştir. Ayrıca literatürde çıkarımsal metin özetleme çalışmalarında sıklıkla kullanılan cümle seçim özniteliklerinin önem dereceleri ağırlıklandırılarak yapılacak sonraki çalışmalara katkı sağlanması hedeflenmektedir. Tez çalışması kapsamında elde edilen otomatik metin özetleme özet metin uzunluk oranı ve cümle seçim öznitelik ağırlıkları kullanılarak yapılan otomatik metin özetleme çalışmasında yüksek başarı değerleri elde edilmiştir. Çalışma kapsamında geliştirilen algoritmanın performansı ROUGE başarı metriği tarafından değerlendirilerek %73 başarı elde etmiştir. Deneysel çalışmanın sonucunda özet metin uzunluk oranı ve özniteliklerin ağırlıklandırılması önerilen modelin otomatik metin özetleme performansını olumlu yönde etkileyerek başarılı sonuçlar verdiği gözlemlenmiştir.

Özet (Çeviri)

Technology has become an indispensable part of modern human life and continues to rapidly simplify our daily routines. One of these conveniences is the ability to analyze large amounts of textual data encountered in the digital world and online platforms quickly and effectively, summarizing it automatically in a computer environment without human intervention. In this study, 32 text datasets belonging to 8 main categories were used, sourced from Wikipedia, the world's largest digital library. These datasets were manually summarized by 12 individuals, including teachers, academics, and engineers, using a web-based application developed as part of the thesis. The consistency and meticulousness of the manual summaries were verified by analyzing the similarities between the summaries. From the manual summaries, it was determined that the average summary length ratio for a summarized text in automatic text summarization was approximately 41.44%. Additionally, it is aimed to contribute to future studies by weighting the importance of sentence selection features, which are frequently used in extractive text summarization research in the literature. Using the summary length ratio and sentence selection feature weights obtained during the thesis study, the automatic text summarization achieved high success rates. The performance of the algorithm developed within the scope of this study was evaluated using the ROUGE success metric, achieving a success rate of 73%. The experimental results demonstrated that the proposed model's summary length ratio and feature weighting positively impacted the automatic text summarization performance, yielding successful outcomes.

Benzer Tezler

  1. Rule-based text summarization in Turkish

    Türkçe için kural tabanlı metin özetleme

    ÇAĞDAŞ CAN BİRANT

    Doktora

    İngilizce

    İngilizce

    2015

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolDokuz Eylül Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. YALÇIN ÇEBİ

  2. Paraphrase identification in turkish using distributed representations of words and sentences

    Dağıtık kelime ve cümle temsilleri kullanılarak türkçe eşanlatım tespiti

    HAKKI ENGİN YORGANCIOĞLU

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEge Üniversitesi

    Uluslararası Bilgisayar Ana Bilim Dalı

    PROF. DR. BAHAR KARAOĞLAN

  3. Türkçe metinlerde duygu analizi

    Sentiment analysis in Turkish texts

    CUMALİ TÜRKMENOĞLU

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. AHMET CÜNEYD TANTUĞ

  4. Sarcasm detection in text using deep neural networks

    Derin sinir ağları kullanılarak metin içinde alaycılık tespiti

    GİZEM GÜMÜŞÇEKİÇCİ

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolIşık Üniversitesi

    Bilgisayar Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ RAHİM DEHKHARGHANİ

  5. Automatic disambiguation of turkish discourse connectives based on a Turkish connective lexicon

    Türkçe söylem bağlaçlarının Türkçe bağlaç sözlüğüne dayalı olarak ayrıştırılması

    KEZBAN BAŞIBÜYÜK

    Doktora

    İngilizce

    İngilizce

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. ALİ HİKMET DOĞRU

    PROF. DR. DENİZ ZEYREK BOZŞAHİN