Large vocabulary speech recognition in noisy environments
Gürültülü ortamlarda geniş kelime hazneli konuşma tanıma
- Tez No: 79308
- Danışmanlar: DOÇ. DR. A. ENİS ÇETİN
- Tez Türü: Yüksek Lisans
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 1998
- Dil: İngilizce
- Üniversite: İhsan Doğramacı Bilkent Üniversitesi
- Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 63
Özet
ÖZET KONUŞMA TANIMA Firas Jabloun Elektrik ve Elektronik Mühendisliği Bölümü Yüksek Lisans Tez Yöneticisi: Doç. Dr. A. Enis Çetin Temmuz 1998 Altbant analizi ve Teager Enerji Operatörüne (TEO) dayal yeni bir konuşma öznitelik parametresi seti geliştirildi. Konuşma işareti önce mefekala içinde düzgün olmayan alt- bantlara bölündü. Sonra, alt-işaretlerin Teager Enerji kestirimleri yapıldı. Son olarak log sıkıştırma ve ters DCT hesaplamasiyla öznitelik vektörleri oluşturuldu. Yeni öznitelik parametreleri (TEOCEP), döşük geçiren bir yapısı olan araba motor sesine karşı görbüz tanıma performansına sahiptir. Bu tezde ayrica geniş kelime hazneli konuşma problemine ilişkin çözümler sunuldu. Kelimeler üçlü-fon temelli HMM ile modellendi. İşlem zamanını azaltmak için. öğrenme süresinde alt kelime hazneleri geliştirilip, ağaç yapılı arama işlemi gerçekleştirildi. Keywords : Konuşma tanıma, altbant analizi, Teager Enerji Operatörü, doğrusal olmayan konuşma modeli, üçlü-fonler, Ağaç yapılı arama stratejisi. iv
Özet (Çeviri)
ABSTRACT LARGE VOCABULARY SPEECH RECOGNITION IN NOISY ENVIRONMENTS Firas Jabloun M.S. in Electrical and Electronics Engineering Supervisor: A. Enis Çetin, Ph. D. July 1998 A new set of speech feature parameters based on multirate subband analysis and the Teager Energy Operator (TEO) is developed. The speech signal is first divided into nonuniform subbands in mel-scale using a multirate filter-bank, then the Teager ener gies of the subsignals are estimated. Finally, the feature vector is constructed by log- compression and inverse DCT computation. The new feature parameters (TEOCEP) have a robust speech recognition performance in car engine noise which has a low pass nature. In this thesis, we also present some solutions to the problem of large vocabulary speech recognition. Triphone-based Hidden Markov Models (HMM) are used to model the vocabulary words. Although the straight forward parallel search strategy gives good recognition performance, the processing time required is found to be long and imprac tical. Therefore another search strategy with similar performance is described. Sub- vocabularies are developed during the training session to reduce the total number of words considered in the search process. The search is then performed in a tree structure by investigating one subvocabulary instead of all the words. Keywords : Speech recognition, Multirate subband analysis. Teager En ergy Operator, Nonlinear speech modeling, Triphones, Tree structure search strategy. m
Benzer Tezler
- Türkçede ayrık konuşma tanımı
Başlık çevirisi yok
ERCAN ÖLÇER
Yüksek Lisans
Türkçe
1993
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiPROF. DR. EŞREF ADALI
- Turkish large vocabulary continuous speech recognition by using limited audio corpus
Kısıtlı ses külliyatı ile Türkçe geniş dağarcıklı sürekli konuşma tanıma
DERYA SUSMAN
Yüksek Lisans
İngilizce
2012
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiBilgisayar Mühendisliği Bölümü
DR. SELÇUK KÖPRÜ
PROF. DR. ADNAN YAZICI
- Statistical language models for large vocabulary Turkish speech recognition
Geniş dağarcıklı Türkçe konuşma tanıma için istatistiksel dil modelleri
HELİN DUTAĞACI
Yüksek Lisans
İngilizce
2002
Elektrik ve Elektronik MühendisliğiBoğaziçi ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. LEVENT M. ARSLAN
- A Large vocabulary speech recognition system for Turkish
Türkçe için geniş sözcük dağarcıklı konuşma tanıma sistemi
CEMAL YILMAZ
Yüksek Lisans
İngilizce
1999
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent ÜniversitesiBilgisayar Yazılımı Ana Bilim Dalı
DOÇ. DR. KEMAL OFLAZER
- Investigation of automatically derived subword units for turkish LVCSR
Türkçe GDSKT için otomatik olarak elde edilmiş kelime altı modellerin incelenmesi
TUNCAY AKSUNGURLU
Yüksek Lisans
İngilizce
2008
Elektrik ve Elektronik MühendisliğiBoğaziçi ÜniversitesiElektrik ve Elektronik Mühendisliği Bölümü
YRD. DOÇ. MURAT SARAÇLAR