Automatic Summarization of Speech Data
Konuşma Verisinin Otomatik Özetlenmesi
- Tez No: 863875
- Danışmanlar: ÖĞR. GÖR. ADAM MOSS
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: İngilizce
- Üniversite: The University of Nottingham
- Enstitü: Yurtdışı Enstitü
- Ana Bilim Dalı: Fizik Ana Bilim Dalı
- Bilim Dalı: Yapay Zeka Bilim Dalı
- Sayfa Sayısı: 65
Özet
Bu tez çalışmasında konuşma verilerinden elde edilen metnin soyutlayıcı özetleme yöntemi ile özetlenmesi üzerinde durulmuştur. Bunun için Pointer Generator Network(PGN) modelinin uygulanmasına karar verilmiştir. Bu modelin tercih edilme sebepleri ise literatürde sıklıkla kullanılması, geliştirilmeye açık bir model olması ve kısa sürede uygulanabileceğinin görülmesidir. Ses verilerinin metne dönüştürüldükten sonraki aşamaları daha önemli kabul edildiğinden, ses işleme kısmı önceden eğitilmiş modellerle sağlanmaktadır. PGN özetleyici modeli, CNN /DM veri seti ile eğitilmiş ve test edilmiştir ve ek olarak BBC veri seti ile test edilmiştir. Test sonuçları ROUGE metriği ile değerlendirilmiş ve en yüksek değer 0,44 F1 puanı olarak elde edilmiştir. Önerilen sistemin sadece güncel ölçütlerle değil aynı zamanda niteliksel testlerle de değerlendirilmesi gerektiğini gösterilmiştir.
Özet (Çeviri)
In this dissertation study it is focused on summarizing the text obtained from the speech data with the abstractive summation method.For this, it was decided to apply the Pointer Generator Network(PGN) model. The reasons for choosing this model are that it is frequently used in the literature, it is a model open to development and it is seen that it can be applied in a short time. Since the stages of the audio data after converting it to text are considered more important, the audio processing part is provided with pre-trained models. The PGN summarizer model is trained and tested with the CNN /DM dataset and additionally tested with the BBC dataset. The test results were evaluated with the ROUGE metric and the highest value was obtained as 0.44 F1 score. It is demonstrated that the proposed system should not be evaluated only by current metrics but also with qualitative tests.
Benzer Tezler
- İngilizce'den Türkçe'ye istatistiksel bilgisayarlı çeviri sistemlerinde alan uyarlaması ile başarının artırılması
Evaluation of domain adaptation approaches on English-to-Turkish statistical machine translation systems
EZGİ YILDIRIM
Yüksek Lisans
Türkçe
2014
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. AHMET CÜNEYD TANTUĞ
- Learning logic rules from text using statistical methods for natural language processing
İstatistiksel yöntemler kullanarak doğal dil işleme amacıyla mantıksal kural öğrenmesi
MISHAL KAZMI
Doktora
İngilizce
2017
Elektrik ve Elektronik MühendisliğiSabancı ÜniversitesiElektrik Mühendisliği Ana Bilim Dalı
PROF. DR. YÜCEL SAYGIN
YRD. DOÇ. DR. PETER SCHÜLLER
- Local context based linear text segmentation
Yerel içerik tabanlı konusal metin bölümlendirme
HAYRETTİN ERDEM
Yüksek Lisans
İngilizce
2014
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. FAZLI CAN
- Automatic speech recognition system for Turkish spoken language
Türkçe dili için otomatik konuşma tanıma sistemi
DOĞAN DALVA
Yüksek Lisans
İngilizce
2012
Elektrik ve Elektronik MühendisliğiIşık ÜniversitesiElektronik Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. HAKAN GÜRKAN
YRD. DOÇ. DR. ÜMİT GÜZ
- Sağlık alanında yayınlanmış akademik çalışmaların doğal dil işleme ve derin öğrenme yöntemleri ile otomatik özetlenmesi
Automatic summarization of academic studies published in the health field using natural language processing and deep learning methods
ANIL KUŞ
Yüksek Lisans
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMersin ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. ÇİĞDEM ACI