Geri Dön

Large vocabulary speech recognition in noisy environments

Gürültülü ortamlarda geniş kelime hazneli konuşma tanıma

  1. Tez No: 79308
  2. Yazar: FİRAS JABLOUN
  3. Danışmanlar: DOÇ. DR. A. ENİS ÇETİN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 1998
  8. Dil: İngilizce
  9. Üniversite: İhsan Doğramacı Bilkent Üniversitesi
  10. Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 63

Özet

ÖZET KONUŞMA TANIMA Firas Jabloun Elektrik ve Elektronik Mühendisliği Bölümü Yüksek Lisans Tez Yöneticisi: Doç. Dr. A. Enis Çetin Temmuz 1998 Altbant analizi ve Teager Enerji Operatörüne (TEO) dayal yeni bir konuşma öznitelik parametresi seti geliştirildi. Konuşma işareti önce mefekala içinde düzgün olmayan alt- bantlara bölündü. Sonra, alt-işaretlerin Teager Enerji kestirimleri yapıldı. Son olarak log sıkıştırma ve ters DCT hesaplamasiyla öznitelik vektörleri oluşturuldu. Yeni öznitelik parametreleri (TEOCEP), döşük geçiren bir yapısı olan araba motor sesine karşı görbüz tanıma performansına sahiptir. Bu tezde ayrica geniş kelime hazneli konuşma problemine ilişkin çözümler sunuldu. Kelimeler üçlü-fon temelli HMM ile modellendi. İşlem zamanını azaltmak için. öğrenme süresinde alt kelime hazneleri geliştirilip, ağaç yapılı arama işlemi gerçekleştirildi. Keywords : Konuşma tanıma, altbant analizi, Teager Enerji Operatörü, doğrusal olmayan konuşma modeli, üçlü-fonler, Ağaç yapılı arama stratejisi. iv

Özet (Çeviri)

ABSTRACT LARGE VOCABULARY SPEECH RECOGNITION IN NOISY ENVIRONMENTS Firas Jabloun M.S. in Electrical and Electronics Engineering Supervisor: A. Enis Çetin, Ph. D. July 1998 A new set of speech feature parameters based on multirate subband analysis and the Teager Energy Operator (TEO) is developed. The speech signal is first divided into nonuniform subbands in mel-scale using a multirate filter-bank, then the Teager ener gies of the subsignals are estimated. Finally, the feature vector is constructed by log- compression and inverse DCT computation. The new feature parameters (TEOCEP) have a robust speech recognition performance in car engine noise which has a low pass nature. In this thesis, we also present some solutions to the problem of large vocabulary speech recognition. Triphone-based Hidden Markov Models (HMM) are used to model the vocabulary words. Although the straight forward parallel search strategy gives good recognition performance, the processing time required is found to be long and imprac tical. Therefore another search strategy with similar performance is described. Sub- vocabularies are developed during the training session to reduce the total number of words considered in the search process. The search is then performed in a tree structure by investigating one subvocabulary instead of all the words. Keywords : Speech recognition, Multirate subband analysis. Teager En ergy Operator, Nonlinear speech modeling, Triphones, Tree structure search strategy. m

Benzer Tezler

  1. Türkçede ayrık konuşma tanımı

    Başlık çevirisi yok

    ERCAN ÖLÇER

  2. Turkish large vocabulary continuous speech recognition by using limited audio corpus

    Kısıtlı ses külliyatı ile Türkçe geniş dağarcıklı sürekli konuşma tanıma

    DERYA SUSMAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2012

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Bilgisayar Mühendisliği Bölümü

    DR. SELÇUK KÖPRÜ

    PROF. DR. ADNAN YAZICI

  3. Statistical language models for large vocabulary Turkish speech recognition

    Geniş dağarcıklı Türkçe konuşma tanıma için istatistiksel dil modelleri

    HELİN DUTAĞACI

    Yüksek Lisans

    İngilizce

    İngilizce

    2002

    Elektrik ve Elektronik MühendisliğiBoğaziçi Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. LEVENT M. ARSLAN

  4. A Large vocabulary speech recognition system for Turkish

    Türkçe için geniş sözcük dağarcıklı konuşma tanıma sistemi

    CEMAL YILMAZ

    Yüksek Lisans

    İngilizce

    İngilizce

    1999

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent Üniversitesi

    Bilgisayar Yazılımı Ana Bilim Dalı

    DOÇ. DR. KEMAL OFLAZER

  5. Investigation of automatically derived subword units for turkish LVCSR

    Türkçe GDSKT için otomatik olarak elde edilmiş kelime altı modellerin incelenmesi

    TUNCAY AKSUNGURLU

    Yüksek Lisans

    İngilizce

    İngilizce

    2008

    Elektrik ve Elektronik MühendisliğiBoğaziçi Üniversitesi

    Elektrik ve Elektronik Mühendisliği Bölümü

    YRD. DOÇ. MURAT SARAÇLAR