New methods for robust speech recognition

Konuşma tanıma için gürültüye dayanıklı yeni yöntemler

Tez No: 46038
Yazar: ENGİN ERZİN
Danışmanlar: DOÇ.DR. A. ENİS ÇETİN
Tez Türü: Yüksek Lisans
Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
Anahtar Kelimeler: Konuşma tanıma, doğrusal öngörü, sımr belirleme, konuşma iyileştirme, altbant ayrışımı, dalgacık dönüşümü, çizgisel spektrum frekansları, cc-kararlı dağılımlar
Yıl: 1995
Dil: İngilizce
Üniversite: İhsan Doğramacı Bilkent Üniversitesi
Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
Ana Bilim Dalı: Belirtilmemiş.
Bilim Dalı: Belirtilmemiş.
Sayfa Sayısı: 93

Özet

Özet KONUŞMA TANIMA İÇİN GÜRÜLTÜYE DAYANIKLI YENİ YÖNTEMLER Engin Erzin Elektrik ve Elektronik Mühendisliği Bölümü Doktora Tez Yöneticisi: Doç. Dr. A. Enis Çetin Eylül 1995 Dayanıklı konuşma tanıma sistemleri için öznitelik parametrelerinin elde edilmesi, sözcük sınırlarının belirlenmesi ve konuşma iyileştirilmesi alanlarında yeni yöntemler geliştirilmiştir. Öznitelik parametrelerinin elde edilmesi ve sözcük sınırlarının belirlenmesi yöntemleri altbant analizine dayalı biçimde geliştirilmiştir. Altbant analizine dayalı iki yeni konuşma öznitelik parametre vektörü (SUBLSF ve SUBCEP) oluşturulmuştur. SUBLSF öznitelik parametrelerini elde etmek için konuşma işareti alt ve üst bantlara ayrılır. Her iki bant için doğrusal öngörü analizi yapılır ve bu analizlerden elde edilen Çizgisel Spektrum Frekansları birleştirilerek SUBLSF öznitelik vektörü oluşturulur. Diğer öznitelik parametre vektörü, SUBCEP, dalgacık analizi veya eşdeğer anlamda altbant analizi kullanılarak oluşturulur. SUBCEP parametreleri gürültülü bantları bastırarak dayanıklı bir başarım sağlamışlardır. Yapılan deneyler sonunda araç gürültüsü altında altbant analizi ile elde edilen öznitelik parametrelerinin yaygın olarak kullanılan tam-bantVI parametrelerinden daha dayanıklı olduğu görülmüştür. Telefon kanallarındaki gürültünün modellenmesinde a-kararlı rasgele süreçler kullanılabilir, a-kararlı rasgele süreçler için geliştirilen uyarlamalı süzgeçler gürültülü konuşmanın iyileştirilmesinde kullanılmış ve konuşma tanıma başarımı artırılmıştır. Dayanıklı konuşma tanıma sistemlerinde bir diğer önemli problem de sözcük sınırlarının belirlenmesidir. Sözcük sınırlarının hatasız belirlenmesi konuşma tanıma başarımmı artırmaktadır. Sözcük sınırlarını belirlemeye yönelik, konuşma işaretinin altbant enerji değerlerine bağlı, yeni bir uzaklık ölçüsü sunulmuştur.

Özet (Çeviri)

Abstract NEW METHODS FOR ROBUST SPEECH RECOGNITION Engin Erzin Ph. D. in Electrical and Electronics Engineering Supervisor: Assoc. Prof. Dr. A. Enis Çetin September 1995 New methods of feature extraction, end-point detection and speech enhance ment are developed for a robust speech recognition system. The methods of feature extraction and end-point detection are based on wavelet analysis or subband analysis of the speech signal. Two new sets of speech feature parameters, SUBLSF's and SUBCEP's, are introduced. Both parameter sets are based on subband analysis. The SUBLSF feature parameters are obtained via linear predictive analysis on subbands. These speech feature parameters can produce better results than the full-band parameters when the noise is colored. The SUBCEP parameters are based on wavelet analysis or equivalently the multirate subband analysis of the speech signal. The SUBCEP parameters also provide robust recognition performance by appropriately deemphasizing the frequency bands corrupted by noise. It is experimentally observed that the subband analysis based feature parameters are more robust than the commonly used full-band analysis based parameters in the presence of car noise. The a-stable random processes can be used to model the impulsive nature mIV of the public network telecommunication noise. Adaptive filtering are developed for a-stable random processes. Adaptive noise cancelation techniques are used to reduce the mismacth between training and testing conditions of the recognition system over telephone lines. Another important problem in isolated speech recognition is to determine the boundaries of the speech utterances or words. Precise boundary detection of utterances improves the performance of speech recognition systems. A new distance measure based on the subband energy levels is introduced for endpoint detection. Keywords : Speech recognition, linear prediction, endpoint detection, speech enhancement, subband decomposition, wavelet trans form, line spectrum frequencies, a-stable distributions.

Benzer Tezler

Tez No
129333
Acoustic feature analysis for robust speech recognition
Daha gürbüz ses tanıma için akustik vektör analizi
ALPAY KOÇ
Yüksek Lisans
İngilizce
2002
Elektrik ve Elektronik Mühendisliği Boğaziçi Üniversitesi
Elektrik ve Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. LEVENT M. ARSLAN
Tez No
382389
Noise robust speech recognition using parallel model compensation and voice activity detection methods
PMT ve ses aktivitesi tespiti metodları kullanarak gürültüye dayanıklı konuşma tanıma
SERHAT HIZLISOY
Yüksek Lisans
İngilizce
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Çukurova Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. ZEKERİYA TÜFEKCİ
Tez No
467198
Seyreklik ve sözlük öğrenme yaklaşımlarının sınıflandırma ve yüz tanımaya uygulanması
Classification and face recognition application of sparsity and dictionary learning based methods
BERNA AZİZOĞLU
Yüksek Lisans
Türkçe
2017
Elektrik ve Elektronik Mühendisliği İstanbul Teknik Üniversitesi
Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
DOÇ. DR. ENDER METE EKŞİOĞLU
Tez No
436330
Classification of vessel acoustic signatures using non-linear scattering based feature extraction
Doğrusal olmayan saçılma temelli oznitelik çıkarma kullanarak gemilerin akustik izlerinin sınıflandırılması
GÖKMEN CAN
Yüksek Lisans
İngilizce
2016
Elektrik ve Elektronik Mühendisliği İhsan Doğramacı Bilkent Üniversitesi
Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. AHMET ENİS ÇETİN
Tez No
400042
Ego noise estimation for robot audition
Başlık çevirisi yok
GÖKHAN İNCE
Doktora
İngilizce
2011
Makine Mühendisliği Tokyo Institute of Technology
PROF. JUNİCHİ IMURA

Geri Dön