Geri Dön

Automatic Summarization of Speech Data

Konuşma Verisinin Otomatik Özetlenmesi

  1. Tez No: 863875
  2. Yazar: ALPASLAN ERDAĞ
  3. Danışmanlar: ÖĞR. GÖR. ADAM MOSS
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: İngilizce
  9. Üniversite: The University of Nottingham
  10. Enstitü: Yurtdışı Enstitü
  11. Ana Bilim Dalı: Fizik Ana Bilim Dalı
  12. Bilim Dalı: Yapay Zeka Bilim Dalı
  13. Sayfa Sayısı: 65

Özet

Bu tez çalışmasında konuşma verilerinden elde edilen metnin soyutlayıcı özetleme yöntemi ile özetlenmesi üzerinde durulmuştur. Bunun için Pointer Generator Network(PGN) modelinin uygulanmasına karar verilmiştir. Bu modelin tercih edilme sebepleri ise literatürde sıklıkla kullanılması, geliştirilmeye açık bir model olması ve kısa sürede uygulanabileceğinin görülmesidir. Ses verilerinin metne dönüştürüldükten sonraki aşamaları daha önemli kabul edildiğinden, ses işleme kısmı önceden eğitilmiş modellerle sağlanmaktadır. PGN özetleyici modeli, CNN /DM veri seti ile eğitilmiş ve test edilmiştir ve ek olarak BBC veri seti ile test edilmiştir. Test sonuçları ROUGE metriği ile değerlendirilmiş ve en yüksek değer 0,44 F1 puanı olarak elde edilmiştir. Önerilen sistemin sadece güncel ölçütlerle değil aynı zamanda niteliksel testlerle de değerlendirilmesi gerektiğini gösterilmiştir.

Özet (Çeviri)

In this dissertation study it is focused on summarizing the text obtained from the speech data with the abstractive summation method.For this, it was decided to apply the Pointer Generator Network(PGN) model. The reasons for choosing this model are that it is frequently used in the literature, it is a model open to development and it is seen that it can be applied in a short time. Since the stages of the audio data after converting it to text are considered more important, the audio processing part is provided with pre-trained models. The PGN summarizer model is trained and tested with the CNN /DM dataset and additionally tested with the BBC dataset. The test results were evaluated with the ROUGE metric and the highest value was obtained as 0.44 F1 score. It is demonstrated that the proposed system should not be evaluated only by current metrics but also with qualitative tests.

Benzer Tezler

  1. İngilizce'den Türkçe'ye istatistiksel bilgisayarlı çeviri sistemlerinde alan uyarlaması ile başarının artırılması

    Evaluation of domain adaptation approaches on English-to-Turkish statistical machine translation systems

    EZGİ YILDIRIM

    Yüksek Lisans

    Türkçe

    Türkçe

    2014

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. AHMET CÜNEYD TANTUĞ

  2. Learning logic rules from text using statistical methods for natural language processing

    İstatistiksel yöntemler kullanarak doğal dil işleme amacıyla mantıksal kural öğrenmesi

    MISHAL KAZMI

    Doktora

    İngilizce

    İngilizce

    2017

    Elektrik ve Elektronik MühendisliğiSabancı Üniversitesi

    Elektrik Mühendisliği Ana Bilim Dalı

    PROF. DR. YÜCEL SAYGIN

    YRD. DOÇ. DR. PETER SCHÜLLER

  3. Local context based linear text segmentation

    Yerel içerik tabanlı konusal metin bölümlendirme

    HAYRETTİN ERDEM

    Yüksek Lisans

    İngilizce

    İngilizce

    2014

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. FAZLI CAN

  4. Automatic speech recognition system for Turkish spoken language

    Türkçe dili için otomatik konuşma tanıma sistemi

    DOĞAN DALVA

    Yüksek Lisans

    İngilizce

    İngilizce

    2012

    Elektrik ve Elektronik MühendisliğiIşık Üniversitesi

    Elektronik Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. HAKAN GÜRKAN

    YRD. DOÇ. DR. ÜMİT GÜZ

  5. Sağlık alanında yayınlanmış akademik çalışmaların doğal dil işleme ve derin öğrenme yöntemleri ile otomatik özetlenmesi

    Automatic summarization of academic studies published in the health field using natural language processing and deep learning methods

    ANIL KUŞ

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMersin Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. ÇİĞDEM ACI