Turkish large vocabulary continuous speech recognition by using limited audio corpus

Kısıtlı ses külliyatı ile Türkçe geniş dağarcıklı sürekli konuşma tanıma

PDF İndir

Tez No: 304983
Yazar: DERYA SUSMAN
Danışmanlar: DR. SELÇUK KÖPRÜ, PROF. DR. ADNAN YAZICI
Tez Türü: Yüksek Lisans
Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
Anahtar Kelimeler: Belirtilmemiş.
Yıl: 2012
Dil: İngilizce
Üniversite: Orta Doğu Teknik Üniversitesi
Enstitü: Fen Bilimleri Enstitüsü
Ana Bilim Dalı: Bilgisayar Mühendisliği Bölümü
Bilim Dalı: Belirtilmemiş.
Sayfa Sayısı: 82

Özet

Türkçe konuşma tanıma çeşitli açılardan zorlu bir problemdir. Zorlukların birçoğu dilin morfolojik yapısından ileri gelmektedir. Türkçe sondan eklemeli bir dil olduğundan, tek bir gövdeden ekler kullanarak birçok yeni kelime oluşturulabilir. Dilin bu özelliği dağarcık dışı kelime sayısını arttırır; bu kelimeler de konuşma tanıyıcısının performansını önemli ölçüde düşürürler. Ayrıca, Türkçe dilinin serbest kelime dizilimine izin vermesi, sağlam dil modelleri oluşturmayı da güçleştirir.Bu tezde, Türkçe GDSKT (Geniş Dağarcıklı Sürekli Konuşma Tanıma) problemini çözmeyi hedefleyen yaklaşımlar ve modeller araştırılmıştır. N-gram dil modellerini oluştururken değişik tanıma birimleri (kelimeler, morflar, kökler ve ekler) kullanılmıştır. Tanıma birimine uygun olarak, 3-gram ve 4-gram dil modelleri üretilmiştir.Konuşma tanımanın çözüm alanı makine öğrenmesi ile ilişkili olduğundan, tanıyıcının performansı akustik modeli oluşturmada kullanılan eğitim verisinin yeterliliğine bağlıdır. Ancak, Türkçe dili için zengin bir ses külliyatı elde etmek zordur. Bu tezde, kısıtlı bir ses külliyatı ile var olan yaklaşımlar kullanılarak Türkçe GDSKT problemi çözülmeye çalışılmıştır. Ayrıca, akustik modelin başarımını arttırmak için çeşitli veri seçme yaklaşımları önerilmiştir.

Özet (Çeviri)

Speech recognition in Turkish Language is a challenging problem in several perspectives. Most of the challenges are related to the morphological structure of the language. Since Turkish is an agglutinative language, it is possible to generate many words from a single stem by using suffixes. This characteristic of the language increases the out-of-vocabulary (OOV) words, which degrade the performance of a speech recognizer dramatically. Also, Turkish language allows words to be ordered in a free manner, which makes it difficult to generate robust language models.In this thesis, the existing models and approaches which address the problem of Turkish LVCSR (Large Vocabulary Continuous Speech Recognition) are explored. Different recognition units (words, morphs, stem and endings) are used in generating the n-gram language models. 3-gram and 4-gram language models are generated with respect to the recognition unit.Since the solution domain of speech recognition is involved with machine learning, the performance of the recognizer depends on the sufficiency of the audio data used in acoustic model training. However, it is difficult to obtain rich audio corpora for the Turkish language. In this thesis, existing approaches are used to solve the problem of Turkish LVCSR by using a limited audio corpus. We also proposed several data selection approaches in order to improve the robustness of the acoustic model.

Benzer Tezler

Tez No
39435
Türkçede ayrık konuşma tanımı
Başlık çevirisi yok
ERCAN ÖLÇER
Yüksek Lisans
Türkçe
1993
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol İstanbul Teknik Üniversitesi
PROF. DR. EŞREF ADALI
Tez No
255903
Statistical and discriminative language modeling for Turkish large vocabulary continuous speech recognition
Türkçe geniş dağarcıklı konuşma tanıma için istatistiksel ve ayırıcı dil modellemesi
EBRU ARISOY
Doktora
İngilizce
2009
Elektrik ve Elektronik Mühendisliği Boğaziçi Üniversitesi
Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. MURAT SARAÇLAR
Tez No
201385
Gizli Markov modeli ile geniş sözlüklü sürekli konuşma tanıma
Large vocabulary continuous speech recognition using hidden Markov model
ERKAN USLU
Yüksek Lisans
Türkçe
2007
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Yıldız Teknik Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. M. ELİF KARSLIGİL
Tez No
526926
Using crosslingual information for keyword search in low resource languages
Kısıtlı kaynaklı dillerde anahtar sözcük arama için diller arası bilgi kullanımı
BOLAJI YUSUF
Yüksek Lisans
İngilizce
2018
Elektrik ve Elektronik Mühendisliği Boğaziçi Üniversitesi
Elektrik Elektronik Mühendisliği Bilim Dalı
PROF. DR. MURAT SARAÇLAR
Tez No
433917
Pre-filtered dynamic time warping for posteriorgram based keyword search
Posteriorgram tabanlı anahtar sözcük arama için ön filtrelemeli dinamik zaman bükme algoritması
GÖZDE ÇETİNKAYA
Yüksek Lisans
İngilizce
2016
Elektrik ve Elektronik Mühendisliği Boğaziçi Üniversitesi
Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. MURAT SARAÇLAR

Geri Dön