Comparison of single channel blind dereverberation methods for speech signals
Tek kanallı ses sinyallerinin ekodan arındırma yöntemlerinin karşılaştırması
- Tez No: 444568
- Danışmanlar: DOÇ. DR. HAKAN ERDOĞAN
- Tez Türü: Yüksek Lisans
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2016
- Dil: İngilizce
- Üniversite: Sabancı Üniversitesi
- Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektronik Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 80
Özet
Yankılanma bir ses dalgasının, ses kaynağından dinleyiciye ulaşırken etraftaki objelerden yansıması ile oluşur. Bu kanal etkisi ya da diğer ismiyle oda dürtü cevabı (RIR), sonlu dürtü cevaplı bir filtre kullanılarak modellenebilir. Yankılanma, özellikle uzun bir filtreyle yankılanma, kayıt altına alınmış ses dosyalarında büyük bozulmalara sebep olmaktadır ve otomatik konuşma tanıma (OKT), dokunmasız telekonferans ve benzeri uygulamaları önemli ölçüde etkilemektedir. Hatta, OKT uygulaması, yankılanmış verilerden eğitilmiş olsa bile başarım kaybı yaşanır. Eğer oda dürtü cevabı biliniyorsa, yankının zarar verici etkisi kolayca kaldırılabilir. Ancak çoğu zaman bu bilgi bilinmemektedir ve işlem kör olarak yapılmak zorundadır. Litaratürde bu problem kör yankıdan arındırma problemi olarak bilinmektedir. Bu problemi çözmek amacıyla önerilen bazı metotlar olmasına rağmen, bu metotlar hem temiz sinyal hem de filtrenin bilinmemesi sebebiyle zorlaşan problemi tamamen çözmeyi başaramamışlardır. Bu tez, bu konuyu çözmek amacıyla önerilmiş olan Laplace tabanlı ağırlıklı kestirim hataş (L-WPE), Gauss tabanlı ağırlıklı kestirim hatası (G-WPE), negatif olmayan matris ayrıştırma (NMF) tabanlı zaman-frekans analizi (NMF+N-CTF), gecikmeli doğrusal kestirim yöntemi (DLP) gibi metotları karşılaştırmayı hedflemekte ve ek olarak seyreklik düzenlemeli ağırlıklı en küşük kareler (SPWLS) ismiyle yeni bir metot önermektedir. Deneylerimizde görülen en iyi sonuçlar genelde L-WPE metoduna sonrasında da GWPE metoduna; uzun oda dürtü cevabına sahip sinyaller için ise işaret gürültü oranı (SNR) ve algısal konuşma kalitesi ölçütü açısından yeni önerilen G-WPE metoduyla ilklendirilmiş SPWLS metoduna aittir.
Özet (Çeviri)
Reverberation is an effect caused by echoes from objects when an audio wave travels from an audio source to a listener. This channel effect can be modeled by a finite impulse response filter which is called a room impulse response (RIR) in case of speech recordings in a room. Reverberation especially with a long filter causes high degradation in recorded speech signals and may affect applications such as Automatic Speech Recognition (ASR), hands-free teleconferencing and many others significantly. It mayeven cause ASR performance to decrease even in a system trained using a database with reverberated speech. If the reverberation environment is known, the echoes can be removed using simple methods. However, in most of the cases, it is unknown and the process needs to be done blind, without knowing the reverberation environment. In the literature, this problem is called the blind dereverberation problem. Although, there are several methods proposed to solve the blind dereverberation problem, due to the diffculty caused by not knowing the signal and the filter, the echoes are hard to remove completely from speech signals. This thesis aims to compare some of these existing methods such as Laplacian based weighted prediction error (L-WPE), Gaussian weighted prediction error (G-WPE), NMF based temporal spectral modeling (NMF+NCTF), delayed linear prediction (DLP) and proposes a new method that we call sparsity penalized weighted least squares (SPWLS). In our experiments, we obtained the best results with L-WPE followed by G-WPE methods, whereas the new SPWLS method initialized with G-WPE method obtained slightly better signal-to-noise ratio and perceptual quality values when the room impulse responses are long.
Benzer Tezler
- Hemipleji rehabilitasyonunda nöromuskuler elektrik stimülasyonu ve ayna tedavisinin etkinliklerinin değerlendirilmesi; prospektif, randomize, kontrollü, tek kör çalişma
'evaluation of the effectiveness of neuromuscular electrical stimulation and mirror therapy in hemiplegia rehabilitation: a prospective, randomized, controlled, single-blind study'
BÜŞRA YEŞİL
Tıpta Uzmanlık
Türkçe
2023
Fiziksel Tıp ve RehabilitasyonSağlık Bilimleri ÜniversitesiFizik Tedavi ve Rehabilitasyon Ana Bilim Dalı
DOÇ. DR. MELİHA KASAPOĞLU AKSOY
- Çevrimsel durağanlık tabanlı uzay-zaman blok kod zamanlaması kestirimi
Cyclostationarity based space-time block code timing estimation
SERHAT GÜL
Yüksek Lisans
Türkçe
2018
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. HAKAN ALİ ÇIRPAN
- Sayısal ses iş istasyonu yazılımlarında ses niteliği farklarının incelenmesi ve karşılaştırılması
Analysis and comparison of sound quality differences in digital audio workstation software
MEHMETHAN DİŞBUDAK
Yüksek Lisans
Türkçe
2021
MüzikYıldız Teknik ÜniversitesiSanat ve Tasarım Ana Bilim Dalı
DOÇ. DR. ARDA EDEN
- X-Işını floresans tekniklerinde matris çoğaltması ile matris soğutmasının dengelenmesi
Balancing of the matrix absorption and the matrix enhancement effects in x-ray fluorescence techniques
YOUSEF SEDİGH
- Akış kanalı içerisindeki engelleyici blokların proton aktaran membran yakıt hücresi karakteristiklerine etkisi
The effect of baffle blocks in flow channel to proton exchange membrane fuel cell characteristics
HÜLYA ÖZTOPRAK
Yüksek Lisans
Türkçe
2007
Makine MühendisliğiGazi ÜniversitesiMakine Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. ATİLLA BIYIKOĞLU