New methods for robust speech recognition
Konuşma tanıma için gürültüye dayanıklı yeni yöntemler
- Tez No: 46038
- Danışmanlar: DOÇ.DR. A. ENİS ÇETİN
- Tez Türü: Yüksek Lisans
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Konuşma tanıma, doğrusal öngörü, sımr belirleme, konuşma iyileştirme, altbant ayrışımı, dalgacık dönüşümü, çizgisel spektrum frekansları, cc-kararlı dağılımlar
- Yıl: 1995
- Dil: İngilizce
- Üniversite: İhsan Doğramacı Bilkent Üniversitesi
- Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Belirtilmemiş.
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 93
Özet
Özet KONUŞMA TANIMA İÇİN GÜRÜLTÜYE DAYANIKLI YENİ YÖNTEMLER Engin Erzin Elektrik ve Elektronik Mühendisliği Bölümü Doktora Tez Yöneticisi: Doç. Dr. A. Enis Çetin Eylül 1995 Dayanıklı konuşma tanıma sistemleri için öznitelik parametrelerinin elde edilmesi, sözcük sınırlarının belirlenmesi ve konuşma iyileştirilmesi alanlarında yeni yöntemler geliştirilmiştir. Öznitelik parametrelerinin elde edilmesi ve sözcük sınırlarının belirlenmesi yöntemleri altbant analizine dayalı biçimde geliştirilmiştir. Altbant analizine dayalı iki yeni konuşma öznitelik parametre vektörü (SUBLSF ve SUBCEP) oluşturulmuştur. SUBLSF öznitelik parametrelerini elde etmek için konuşma işareti alt ve üst bantlara ayrılır. Her iki bant için doğrusal öngörü analizi yapılır ve bu analizlerden elde edilen Çizgisel Spektrum Frekansları birleştirilerek SUBLSF öznitelik vektörü oluşturulur. Diğer öznitelik parametre vektörü, SUBCEP, dalgacık analizi veya eşdeğer anlamda altbant analizi kullanılarak oluşturulur. SUBCEP parametreleri gürültülü bantları bastırarak dayanıklı bir başarım sağlamışlardır. Yapılan deneyler sonunda araç gürültüsü altında altbant analizi ile elde edilen öznitelik parametrelerinin yaygın olarak kullanılan tam-bantVI parametrelerinden daha dayanıklı olduğu görülmüştür. Telefon kanallarındaki gürültünün modellenmesinde a-kararlı rasgele süreçler kullanılabilir, a-kararlı rasgele süreçler için geliştirilen uyarlamalı süzgeçler gürültülü konuşmanın iyileştirilmesinde kullanılmış ve konuşma tanıma başarımı artırılmıştır. Dayanıklı konuşma tanıma sistemlerinde bir diğer önemli problem de sözcük sınırlarının belirlenmesidir. Sözcük sınırlarının hatasız belirlenmesi konuşma tanıma başarımmı artırmaktadır. Sözcük sınırlarını belirlemeye yönelik, konuşma işaretinin altbant enerji değerlerine bağlı, yeni bir uzaklık ölçüsü sunulmuştur.
Özet (Çeviri)
Abstract NEW METHODS FOR ROBUST SPEECH RECOGNITION Engin Erzin Ph. D. in Electrical and Electronics Engineering Supervisor: Assoc. Prof. Dr. A. Enis Çetin September 1995 New methods of feature extraction, end-point detection and speech enhance ment are developed for a robust speech recognition system. The methods of feature extraction and end-point detection are based on wavelet analysis or subband analysis of the speech signal. Two new sets of speech feature parameters, SUBLSF's and SUBCEP's, are introduced. Both parameter sets are based on subband analysis. The SUBLSF feature parameters are obtained via linear predictive analysis on subbands. These speech feature parameters can produce better results than the full-band parameters when the noise is colored. The SUBCEP parameters are based on wavelet analysis or equivalently the multirate subband analysis of the speech signal. The SUBCEP parameters also provide robust recognition performance by appropriately deemphasizing the frequency bands corrupted by noise. It is experimentally observed that the subband analysis based feature parameters are more robust than the commonly used full-band analysis based parameters in the presence of car noise. The a-stable random processes can be used to model the impulsive nature mIV of the public network telecommunication noise. Adaptive filtering are developed for a-stable random processes. Adaptive noise cancelation techniques are used to reduce the mismacth between training and testing conditions of the recognition system over telephone lines. Another important problem in isolated speech recognition is to determine the boundaries of the speech utterances or words. Precise boundary detection of utterances improves the performance of speech recognition systems. A new distance measure based on the subband energy levels is introduced for endpoint detection. Keywords : Speech recognition, linear prediction, endpoint detection, speech enhancement, subband decomposition, wavelet trans form, line spectrum frequencies, a-stable distributions.
Benzer Tezler
- Acoustic feature analysis for robust speech recognition
Daha gürbüz ses tanıma için akustik vektör analizi
ALPAY KOÇ
Yüksek Lisans
İngilizce
2002
Elektrik ve Elektronik MühendisliğiBoğaziçi ÜniversitesiElektrik ve Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. LEVENT M. ARSLAN
- Noise robust speech recognition using parallel model compensation and voice activity detection methods
PMT ve ses aktivitesi tespiti metodları kullanarak gürültüye dayanıklı konuşma tanıma
SERHAT HIZLISOY
Yüksek Lisans
İngilizce
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÇukurova ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. ZEKERİYA TÜFEKCİ
- Seyreklik ve sözlük öğrenme yaklaşımlarının sınıflandırma ve yüz tanımaya uygulanması
Classification and face recognition application of sparsity and dictionary learning based methods
BERNA AZİZOĞLU
Yüksek Lisans
Türkçe
2017
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
DOÇ. DR. ENDER METE EKŞİOĞLU
- Classification of vessel acoustic signatures using non-linear scattering based feature extraction
Doğrusal olmayan saçılma temelli oznitelik çıkarma kullanarak gemilerin akustik izlerinin sınıflandırılması
GÖKMEN CAN
Yüksek Lisans
İngilizce
2016
Elektrik ve Elektronik Mühendisliğiİhsan Doğramacı Bilkent ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. AHMET ENİS ÇETİN