Geri Dön

Çıkarıcı Türkçe metin özetleme performansını iyileştirmek için yeni yöntemler

New methods for improving the performance of extractive Turkish text summarization

  1. Tez No: 751536
  2. Yazar: SALİH BAL
  3. Danışmanlar: DR. ÖĞR. ÜYESİ EFNAN ŞORA GÜNAL
  4. Tez Türü: Doktora
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: Türkçe
  9. Üniversite: Eskişehir Osmangazi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Telekomünikasyon - Sinyal İşleme Bilim Dalı
  13. Sayfa Sayısı: 82

Özet

Otomatik metin özetleme, manuel müdahale olmaksızın bir metnin kısa ve öz bir versiyonunu elde etmeyi amaçlar. Günümüz dijital ortamlarında ve internette karşılaşılan büyük miktarda metin verisi göz önüne alındığında, bu verilerin doğru ve hızlı bir şekilde yorumlanabilmesi için otomatik metin özetleme sistemlerinin performansı hayati önem taşımaktadır. Otomatik metin özetleme, orijinal metnin en alakalı tümcelerinin seçildiği çıkarıcı türde veya orijinal metnin kısaltılmış ve başka sözcüklerle ifade edilmiş bir versiyonunun elde edildiği özetleyici türde olabilir. Bu tez, özellikle çıkarıcı Türkçe metin özetleme performansını geliştirmeyi amaçlamaktadır. Bu amaçla, ortak özniteliklerin ve ön işleme tekniklerinin otomatik metin özetleme performansı üzerindeki etkisi, çeşitli öznitelik seçme yöntemleri ve geleneksel makine öğrenimi algoritmaları kullanılarak kapsamlı bir şekilde analiz edilmiştir. Ayrıca, gizli anlamsal analize dayalı yeni bir ayırt edici öznitelik önerilmiştir. İlave olarak, farklı derin öğrenme modellerinin özetleme performansları analiz edilmiştir. Deneysel çalışmada toplam 120 belge ve 1.466 cümleden oluşan iki farklı veri seti kullanılmıştır. Özetleme performansını değerlendirmek için çeşitli başarı ölçütleri kullanılmıştır. Deneysel çalışmanın sonuçları, özetleme performansını iyileştiren optimal öznitelik alt kümesi ve en kullanışlı ön işleme yöntemleri ile en başarılı derin öğrenme modellerini ortaya çıkarmıştır. Ayrıca, önerilen özniteliğin özetleme performansını daha da iyileştirdiği doğrulanmıştır.

Özet (Çeviri)

Automatic text summarization aims to obtain a brief and concise version of a text without manual intervention. Considering the large amount of text data encountered in today's digital media as well as on the Internet, the performance of automatic text summarization systems is vital to be able to interpret this data accurately and quickly. Automatic text summarization can be of either extractive type, where the most relevant sentences of the original text are chosen, or abstractive type, where a shortened and paraphrased version of the original text is obtained. This dissertation aims to improve the performance of extractive Turkish text summarization particularly. For this purpose, the impact of common features and preprocessing techniques on the performance of automatic text summarization was thoroughly analyzed using several feature selection methods and traditional machine learning algorithms. Also, a new distinctive feature based on latent semantic analysis was proposed. Moreover, the summarization performances of different deep learning models were analyzed. Two different datasets consisting of a total of 120 documents and 1,466 sentences were used in the experimental work. Several success metrics were utilized to assess the summarization performance. The results of the experimental work revealed the optimal feature subset, the most useful preprocessing methods that can improve the summarization performance as well as the best performing deep learning models. Moreover, it was verified that the proposed feature further improves the performance.

Benzer Tezler

  1. A deep learning-based extractive text summarization system for Turkish news articles

    Türkçe haber metinleri için derin öğrenme tabanlı çıkarıcı metin özetleme sistemi

    ÖZCAN GÜNDEŞ

    Yüksek Lisans

    İngilizce

    İngilizce

    2020

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi Üniversitesi

    Yönetim Bilişim Sistemleri Ana Bilim Dalı

    YRD. DOÇ. AHMET ONUR DURAHİM

  2. Metin çizgelerinde bağımsız kümelere dayalı çıkarımsal metin özetleme

    Extractive text summarization based on independent sets in text graphs

    TANER UÇKAN

    Doktora

    Türkçe

    Türkçe

    2020

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİnönü Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. ALİ KARCI

  3. Abstractive summarization with semantically-driven evaluation and reinforcement learning

    Anlamsal odaklı değerlendirme ve pekiştirmeli öğrenme ile soyutlayıcı özetleme

    FİGEN BEKEN FİKRİ

    Doktora

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSabancı Üniversitesi

    Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı

    PROF. DR. AYŞE BERRİN YANIKOĞLU YEŞİLYURT

    PROF. DR. KEMAL OFLAZER

  4. Derin öğrenme yöntemleri kullanılarak Türkçe haber metinlerinden haber başlığı üretilmesi

    Generating news headline from Turkish news using deep learning methods

    ENİSE KARAKOÇ

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGebze Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ BURCU YILMAZ

  5. Otomatik metin özetleme sistemi

    Automatic tex summarization system

    AYSUN GÜRAN

    Doktora

    Türkçe

    Türkçe

    2013

    MatematikYıldız Teknik Üniversitesi

    Matematik Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. NİLGÜN GÜLER BAYAZIT