Acoustic feature analysis for robust speech recognition
Daha gürbüz ses tanıma için akustik vektör analizi
- Tez No: 129333
- Danışmanlar: DOÇ. DR. LEVENT M. ARSLAN
- Tez Türü: Yüksek Lisans
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2002
- Dil: İngilizce
- Üniversite: Boğaziçi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektrik ve Elektronik Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 59
Özet
ÖZET DAHA GURBUZ SES TANIMA İÇİN AKUSTİK VEKTÖR ANALİZİ Hemen tüm ses tanıma sistemlerinde mel frekans kepstral katsayı (MFCC) kullanımı çok yaygın bir şekilde kabul edilmiştir. Fakat gürültülü ortamlarda hala performans sorunları yaşanmaktadır. Gürbüzlüğü sağlamak amacıyla özellik vektörleri ile ilgili araştırmalar yapılagelmektedir. Relative Spectral Perceptual Linear Predictive katsayıları (RASTA-PLP) da bu metodlardan birisidir ve telefon kanallarında rastlanılan gürültüyü engellemeye çalışır. Bu tezde RASTA-PLP, PLP ve MFCC özellik vektörleri kullanılarak gürültülü ortamlarda Türkçe sözcük tanıma sisteminde performans değerlendirmeleri yapılacaktır. MFCC ve RASTA-PLP katsayılarından yeni özellik vektörü oluşturularak yüksek performanslı gürbüz ses tanıma sistemi elde edilmeye çalışılacaktır. Yeni özellik vektörü, tanıma, performansını gürültülü ortamlarda etkili bir şekilde artırmak için kullanılacaktır..
Özet (Çeviri)
IV ABSTRACT ACOUSTIC FEATURE ANALYSIS FOR ROBUST SPEECH RECOGNITION It has been widely accepted to use mel frequency cepstrum coefficients (MFCC) in almost all of the recognition systems. However, there are still some performance problems in noisy environments. Many approaches to formulate better acoustic feature representations have been investigated for robustness issues. Relative-Spectral Perceptual linear prediction (RASTA-PLP) method is one of the proposed methods and claims to overcome distortions over telephone channels. In this thesis, we investigate the performances of using RASTA-PLP, PLP and MFCC feature coefficients in noisy environments for an isolated word recognition system in Turkish. A new set of mixed MFCC and RASTA-PLP feature vector is used to develop a high performance robust recognition system. The new feature parameters are used to effectively increase the recognition performance in adverse environments.
Benzer Tezler
- Classification of vessel acoustic signatures using non-linear scattering based feature extraction
Doğrusal olmayan saçılma temelli oznitelik çıkarma kullanarak gemilerin akustik izlerinin sınıflandırılması
GÖKMEN CAN
Yüksek Lisans
İngilizce
2016
Elektrik ve Elektronik Mühendisliğiİhsan Doğramacı Bilkent ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. AHMET ENİS ÇETİN
- Lifelong learning for auditory scene analysis
İşitsel sahne analizi için hayat boyu öğrenme
BARIŞ BAYRAM
Doktora
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. GÖKHAN İNCE
- MEMS mikrofon dizini ile varış zaman farkı esaslı akustik yön tespiti
Time difference of arrival based acoustic direction estimation with MEMS microphone array
NURİ BAŞAR
Yüksek Lisans
Türkçe
2024
Savunma ve Savunma Teknolojileriİstanbul Teknik ÜniversitesiSavunma Teknolojileri Ana Bilim Dalı
PROF. DR. TAYFUN AKGÜL
- Investigation of acoustic and dynamic properties of weatherstrips used in vehicle doors
Havacılık ve otomotiv sektöründe kullanılan kapı sızdırmazlık elemanlarının akustik ve dinamik özelliklerinin incelenmesi
ORÇUN SAF
Doktora
İngilizce
2022
Fizik ve Fizik Mühendisliğiİstanbul Teknik ÜniversitesiMakine Mühendisliği Ana Bilim Dalı
PROF. DR. HALUK EROL