Acoustic feature analysis for robust speech recognition
Daha gürbüz ses tanıma için akustik vektör analizi
- Tez No: 129333
- Danışmanlar: DOÇ. DR. LEVENT M. ARSLAN
- Tez Türü: Yüksek Lisans
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2002
- Dil: İngilizce
- Üniversite: Boğaziçi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektrik ve Elektronik Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 59
Özet
ÖZET DAHA GURBUZ SES TANIMA İÇİN AKUSTİK VEKTÖR ANALİZİ Hemen tüm ses tanıma sistemlerinde mel frekans kepstral katsayı (MFCC) kullanımı çok yaygın bir şekilde kabul edilmiştir. Fakat gürültülü ortamlarda hala performans sorunları yaşanmaktadır. Gürbüzlüğü sağlamak amacıyla özellik vektörleri ile ilgili araştırmalar yapılagelmektedir. Relative Spectral Perceptual Linear Predictive katsayıları (RASTA-PLP) da bu metodlardan birisidir ve telefon kanallarında rastlanılan gürültüyü engellemeye çalışır. Bu tezde RASTA-PLP, PLP ve MFCC özellik vektörleri kullanılarak gürültülü ortamlarda Türkçe sözcük tanıma sisteminde performans değerlendirmeleri yapılacaktır. MFCC ve RASTA-PLP katsayılarından yeni özellik vektörü oluşturularak yüksek performanslı gürbüz ses tanıma sistemi elde edilmeye çalışılacaktır. Yeni özellik vektörü, tanıma, performansını gürültülü ortamlarda etkili bir şekilde artırmak için kullanılacaktır..
Özet (Çeviri)
IV ABSTRACT ACOUSTIC FEATURE ANALYSIS FOR ROBUST SPEECH RECOGNITION It has been widely accepted to use mel frequency cepstrum coefficients (MFCC) in almost all of the recognition systems. However, there are still some performance problems in noisy environments. Many approaches to formulate better acoustic feature representations have been investigated for robustness issues. Relative-Spectral Perceptual linear prediction (RASTA-PLP) method is one of the proposed methods and claims to overcome distortions over telephone channels. In this thesis, we investigate the performances of using RASTA-PLP, PLP and MFCC feature coefficients in noisy environments for an isolated word recognition system in Turkish. A new set of mixed MFCC and RASTA-PLP feature vector is used to develop a high performance robust recognition system. The new feature parameters are used to effectively increase the recognition performance in adverse environments.
Benzer Tezler
- Classification of vessel acoustic signatures using non-linear scattering based feature extraction
Doğrusal olmayan saçılma temelli oznitelik çıkarma kullanarak gemilerin akustik izlerinin sınıflandırılması
GÖKMEN CAN
Yüksek Lisans
İngilizce
2016
Elektrik ve Elektronik Mühendisliğiİhsan Doğramacı Bilkent ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. AHMET ENİS ÇETİN
- Lifelong learning for auditory scene analysis
İşitsel sahne analizi için hayat boyu öğrenme
BARIŞ BAYRAM
Doktora
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. GÖKHAN İNCE
- Açıklanabilir yapay zeka ve akustik sinyaller kullanılarak endüstriyel makinelerde anomali tespiti
Anomaly detection in industrial machines using explainable ai and acoustic signals
BETÜL SENA ÇAĞLAR
Yüksek Lisans
Türkçe
2025
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. DEVRİM AKGÜN
- Detection and classification of flaws from ultrasonic tomography images of composite materials based on deep learning
Derin öğrenme tabanlı kompozit malzemelerin ultrasonik tomografi görüntülerinden kusurların tespiti ve sınıflandırılması
ABDULKADİR GÜLŞEN
Doktora
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAbdullah Gül ÜniversitesiElektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. BURCU GÜNGÖR
DR. BURAK KOLUKISA