Automatic speech recognition system adaptation for spoken lecture processing
Sözlü ders anlatımlarının işlenmesi için otomatik konuşma tanıma sisteminin uyarlanması
- Tez No: 668199
- Danışmanlar: PROF. MURAT SARAÇLAR, DR. ÖĞR. ÜYESİ EBRU ARISOY SARAÇLAR
- Tez Türü: Yüksek Lisans
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2021
- Dil: İngilizce
- Üniversite: Boğaziçi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 65
Özet
Yapay sinir ağlarındaki son gelişmeler, Otomatik Konuşma Tanıma'da (OKT) önemli iyileştirmeler getirmiştir. Bununla birlikte, sinir ağı tabanlı modellerin performansı çoğunlukla büyük miktarda verinin ve hesaplama kaynaklarının mevcudiyetine bağlıdır. Sınırlı miktarda alan içi veri olduğunda, akustik ve dil modeli uyarlama yöntemleri kullanılır. Bu yöntemler, modelin parametrelerini öğrenirken büyük miktarda alan dışı veri ile birlikte sınırlı alan içi veri de kullanır. Bu çalışma, İngilizce ve Türkçe sözlü ders anlatımlarını işleme için geliştirilen sinir ağı tabanlı ASR sistemlerinde farklı uyarlama yöntemlerini araştırmaktadır. Biz temel olarak konuşmacı uyarlama, akustik durum uyarlama ve her iki uyarlamanın birlikte yapılmasının etkisini sınırlı miktarda sözlü ders anlatımları verisi ile araştırıyoruz. Alan dışı veri ile bir kaynak model oluşturmanın ve bu modeli sınırlı miktarda alan içi veri ile uyarlamanın hem hibrit akustik model tabanlı OKT sistemlerinde hem de uçtan uca eğitilen OKT sistemlerinde başarım artışı sağladığını gösteriyoruz.
Özet (Çeviri)
The recent developments in artificial neural networks has brought significant improvement in Automatic Speech Recognition (ASR). However the performance of the neural network based models mostly depends on the availability of large amounts of data and computational resources. When there is limited amount of in-domain data, acoustic and language model adaptation methods are used. These methods utilise large amount of out-of-domain data as well as limited in-domain data while learning the parameters of the model. This work explores different adaptation methods in neural network based ASR systems developed for spoken lecture processing in English and in Turkish. We mainly investigate speaker adaptation, acoustic condition adaptation and effect of both adaptations together with limited amount of spoken lecture data. We show that building a source model with out-of-domain data and adapting this model with limited in-domain data yields improvement in performance both in hybrid acoustic model based ASR systems and in end-to-end ASR systems.
Benzer Tezler
- Doğal dil işleme teknikleri kullanılarak türkçe mobil asistan yazılımı geliştirilmesi
Development of a turkish mobile assistant software using natural language processing techniques
GÖKHAN ÇELİKKAYA
Yüksek Lisans
Türkçe
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. GÜLŞEN ERYİĞİT
- Speaker verification for microphone suitable data and audio diarization for Turkish broadcast news
Mikrofon verisine uygun konuşmacı doğrulama ve Türkçe haber programları için işitsel bölütleme
OĞUZ YILMAZ
Yüksek Lisans
İngilizce
2011
Elektrik ve Elektronik MühendisliğiBoğaziçi ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. MURAT SARAÇLAR
- Statistical and discriminative language modeling for Turkish large vocabulary continuous speech recognition
Türkçe geniş dağarcıklı konuşma tanıma için istatistiksel ve ayırıcı dil modellemesi
EBRU ARISOY
Doktora
İngilizce
2009
Elektrik ve Elektronik MühendisliğiBoğaziçi ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. MURAT SARAÇLAR
- İngilizce'den Türkçe'ye istatistiksel bilgisayarlı çeviri sistemlerinde alan uyarlaması ile başarının artırılması
Evaluation of domain adaptation approaches on English-to-Turkish statistical machine translation systems
EZGİ YILDIRIM
Yüksek Lisans
Türkçe
2014
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. AHMET CÜNEYD TANTUĞ
- Automatic speech recognition system for Turkish spoken language
Türkçe dili için otomatik konuşma tanıma sistemi
DOĞAN DALVA
Yüksek Lisans
İngilizce
2012
Elektrik ve Elektronik MühendisliğiIşık ÜniversitesiElektronik Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. HAKAN GÜRKAN
YRD. DOÇ. DR. ÜMİT GÜZ