Ampirik kip ayrıştırması yöntemi ile uyarlanır eşikleme tabanlı konuşma iyileştirme ve sesli etkinlik algılama
Speech enhancement and voice activity detection based on adaptive thresholding using empirical mode decomposition
- Tez No: 525313
- Danışmanlar: DR. ÖĞR. ÜYESİ ERKAN ZEKİ ENGİN
- Tez Türü: Doktora
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2018
- Dil: Türkçe
- Üniversite: Ege Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Elektronik Bilim Dalı
- Sayfa Sayısı: 177
Özet
Bu çalışmada, gürültülü konuşma sinyallerinin içkin kip fonksiyonu katsayılarına Teager enerji operatörünün uygulanması ile çıkartılan enerji dağılımının Gamma istatistiksel modeline dayanan yeni bir sesli/konuşma etkinlik algılama ve konuşma iyileştirme algoritması önerilmiştir. Gamma dağılım fonksiyonu, gürültülü konuşma ve kestirilen gürültünün Teager enerji uygulanmış içkin kip fonksiyonu katsayılarından uyarlanır eşik değerlerinin belirlenmesinde kullanılmıştır. Simetrik Kullback-Leibler uzaklığı ile konuşma ya da gürültü olma olasılığı üzerinden uyarlanır eşik değerleri belirlenmiş ve her kip için hesaplanmıştır. Gürültülü konuşma sinyallerinin içkin kip fonksiyonu katsayılarının bu uyarlanır eşik değerlerinden geçirilmesi ile konuşma ve konuşma olmayan bölgeler belirlenerek sesli etkinlik algılama gerçeklenmiştir. Konuşma iyileştirme algoritması için ise bu katsayıların uyarlanır eşik değerleri kullanılarak oluşturulan bir yarı-yumuşak eşikleme fonksiyonundan geçirilmesi ile iyileştirilmiş konuşmalar elde edilmiştir. Yöntemlerin test edilmesinde İngilizce için NOIZEUS ve Türkçe için ise ODTÜ veri tabanı kullanılmıştır. Yöntemler yedi farklı gürültü tipi ve beş farklı sinyal gürültü oranı seviyesi koşullarında değerlendirilmiştir. Önerilen sesli etkinlik algılama yöntemi; konuşma doğruluk oranı, konuşma dışı doğruluk oranı ve genel doğruluk oranı ölçütlerine göre literatürdeki yöntemlere üstünlük sağlamıştır. Benzer şekilde, önerilen konuşma iyileştirme yöntemi nesnel kalite ve anlaşılabilirlik ölçütleri ile değerlendirilmiş ve literatürde sıklıkla kullanılan diğer yöntemler ile karşılaştırılmıştır. Tüm sonuçlar göz önünde bulundurulduğunda önerilen yöntem hem gürültü azaltmada hem de anlaşılabilirliğin sağlanmasında diğer yöntemlere göre daha başarılı bulunmuştur.
Özet (Çeviri)
In this study, a new voice/speech activity detection and speech enhancement algorithms based on Gamma statistical model of the energy distribution extractred by Teager energy operator applied to intrinsic mode functions coefficients of noisy speech signals are proposed. The Gamma distribution function is used to determine the adaptive threshold values from Teager energy operated intrinsic mode function coefficients of noisy speech and estimated noise signal. Adaptive threshold values are determined and calculated for each mode based on the probability of speech or noise with Symmetric Kullback-Leibler divergence. The speech and non-speech regions are obtained by applying adaptive thresholding in these coefficients of noisy speech. For speech enhancement algorithms, the enhanced speech signals are obtained by a semi-soft thresholding function which is utilized by thresholded intrinsic mode coefficients of noisy speech. The proposed methods are tested on NOIZEUS for English and on METU for Turkish speech database and evaluated for seven kinds of noises across five different SNR levels. The proposed voice activity detection method is superior to other literature methods in terms of speech hit rate (HR1), non-speech hit rate (HR0) and overall accuracy rate. Similarly, the proposed speech enhancement method is compared to other methods frequently used in the literature in terms of objective quality and intelligibility mesaures. Simulation results show that the proposed methods are effective and outperformed to provide in terms of noise reduction and intelligibility compared with other speech enhancement methods for different SNR levels.
Benzer Tezler
- Meme tümörünün erken teşhisine yönelik titreşim tabanlı sistem tasarımı
Vibration-based system design for early detection of breast tumors
MEHMET ÜMİT AK
Doktora
Türkçe
2024
Elektrik ve Elektronik MühendisliğiAkdeniz ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. SÜLEYMAN BİLGİN
- Rüzgâr hızındaki doğrusal olmayan dinamikler ile baş edebilen gürbüz tahmin modeli
Robust forecasting model coping with nonlinear dynamics in wind speed
CANER BARIŞ
Yüksek Lisans
Türkçe
2023
Elektrik ve Elektronik MühendisliğiZonguldak Bülent Ecevit ÜniversitesiElektrik ve Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. AYTAÇ ALTAN
- New approach for empirical mode decomposition based on double filtration process
Çıft fıltrasyon sürecı dayalı ampırık model yarışma ıçın yenı yaklaşım
DOAA SAMEER ABDÜLKAREEM
Yüksek Lisans
İngilizce
2014
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFatih ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. KADİR TUFAN
- Sürekli mıknatıslı senkron motorda akı sinyali kullanılarak stator sargı arızası teşhisi
Stator winding fault diagnosis using flux signal in permanent magnet synchronous motor
RUMEYSA SELÇUK AKSOY
Yüksek Lisans
Türkçe
2022
Elektrik ve Elektronik MühendisliğiTokat Gaziosmanpaşa ÜniversitesiElektrik ve Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. ZAFER DOĞAN
- Assessment of features and classifiers forbluetooth rf fingerprinting
Bluetooth sinyallerinin RF parmak izi yöntemi ile sınıflandırılmasında öznitelikler ve sınıflandırıcıların değerlendirilmesi
AYSHA B. M. ALI AYSHA B. M. ALI
Doktora
İngilizce
2019
Elektrik ve Elektronik MühendisliğiAtılım ÜniversitesiMühendislik Sistemlerinin Modellenmesi ve Tasarımı Ana Bilim Dalı
PROF. DR. ALİ KARA