Geri Dön

Automatic Summarization of Speech Data

Konuşma Verisinin Otomatik Özetlenmesi

  1. Tez No: 863875
  2. Yazar: ALPASLAN ERDAĞ
  3. Danışmanlar: ÖĞR. GÖR. ADAM MOSS
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: İngilizce
  9. Üniversite: The University of Nottingham
  10. Enstitü: Yurtdışı Enstitü
  11. Ana Bilim Dalı: Fizik Ana Bilim Dalı
  12. Bilim Dalı: Yapay Zeka Bilim Dalı
  13. Sayfa Sayısı: 65

Özet

Bu tez çalışmasında konuşma verilerinden elde edilen metnin soyutlayıcı özetleme yöntemi ile özetlenmesi üzerinde durulmuştur. Bunun için Pointer Generator Network(PGN) modelinin uygulanmasına karar verilmiştir. Bu modelin tercih edilme sebepleri ise literatürde sıklıkla kullanılması, geliştirilmeye açık bir model olması ve kısa sürede uygulanabileceğinin görülmesidir. Ses verilerinin metne dönüştürüldükten sonraki aşamaları daha önemli kabul edildiğinden, ses işleme kısmı önceden eğitilmiş modellerle sağlanmaktadır. PGN özetleyici modeli, CNN /DM veri seti ile eğitilmiş ve test edilmiştir ve ek olarak BBC veri seti ile test edilmiştir. Test sonuçları ROUGE metriği ile değerlendirilmiş ve en yüksek değer 0,44 F1 puanı olarak elde edilmiştir. Önerilen sistemin sadece güncel ölçütlerle değil aynı zamanda niteliksel testlerle de değerlendirilmesi gerektiğini gösterilmiştir.

Özet (Çeviri)

In this dissertation study it is focused on summarizing the text obtained from the speech data with the abstractive summation method.For this, it was decided to apply the Pointer Generator Network(PGN) model. The reasons for choosing this model are that it is frequently used in the literature, it is a model open to development and it is seen that it can be applied in a short time. Since the stages of the audio data after converting it to text are considered more important, the audio processing part is provided with pre-trained models. The PGN summarizer model is trained and tested with the CNN /DM dataset and additionally tested with the BBC dataset. The test results were evaluated with the ROUGE metric and the highest value was obtained as 0.44 F1 score. It is demonstrated that the proposed system should not be evaluated only by current metrics but also with qualitative tests.

Benzer Tezler

  1. Büyük dil modelleri kullanan derin öğrenme tabanlı dinamik çok modlu veri özetleme yaklaşımları

    Deep learning based multi modal data summarization approaches using large language models

    TURAN GÖKTUĞ ALTUNDOĞAN

    Doktora

    Türkçe

    Türkçe

    2025

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. MEHMET KARAKÖSE

  2. İngilizce'den Türkçe'ye istatistiksel bilgisayarlı çeviri sistemlerinde alan uyarlaması ile başarının artırılması

    Evaluation of domain adaptation approaches on English-to-Turkish statistical machine translation systems

    EZGİ YILDIRIM

    Yüksek Lisans

    Türkçe

    Türkçe

    2014

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. AHMET CÜNEYD TANTUĞ

  3. Learning logic rules from text using statistical methods for natural language processing

    İstatistiksel yöntemler kullanarak doğal dil işleme amacıyla mantıksal kural öğrenmesi

    MISHAL KAZMI

    Doktora

    İngilizce

    İngilizce

    2017

    Elektrik ve Elektronik MühendisliğiSabancı Üniversitesi

    Elektrik Mühendisliği Ana Bilim Dalı

    PROF. DR. YÜCEL SAYGIN

    YRD. DOÇ. DR. PETER SCHÜLLER

  4. Multilingual, multimodal and explainable approaches for automated fact-checking problem

    Otomatik doğrulama problemi için çok dilli, çok modlu ve açıklanabilir yaklaşımlar

    RECEP FIRAT ÇEKİNEL

    Doktora

    İngilizce

    İngilizce

    2025

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. PINAR KARAGÖZ

  5. Local context based linear text segmentation

    Yerel içerik tabanlı konusal metin bölümlendirme

    HAYRETTİN ERDEM

    Yüksek Lisans

    İngilizce

    İngilizce

    2014

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. FAZLI CAN