Geri Dön

Ampirik kip ayrıştırması yöntemi ile uyarlanır eşikleme tabanlı konuşma iyileştirme ve sesli etkinlik algılama

Speech enhancement and voice activity detection based on adaptive thresholding using empirical mode decomposition

  1. Tez No: 525313
  2. Yazar: ÖZKAN ARSLAN
  3. Danışmanlar: DR. ÖĞR. ÜYESİ ERKAN ZEKİ ENGİN
  4. Tez Türü: Doktora
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2018
  8. Dil: Türkçe
  9. Üniversite: Ege Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Elektronik Bilim Dalı
  13. Sayfa Sayısı: 177

Özet

Bu çalışmada, gürültülü konuşma sinyallerinin içkin kip fonksiyonu katsayılarına Teager enerji operatörünün uygulanması ile çıkartılan enerji dağılımının Gamma istatistiksel modeline dayanan yeni bir sesli/konuşma etkinlik algılama ve konuşma iyileştirme algoritması önerilmiştir. Gamma dağılım fonksiyonu, gürültülü konuşma ve kestirilen gürültünün Teager enerji uygulanmış içkin kip fonksiyonu katsayılarından uyarlanır eşik değerlerinin belirlenmesinde kullanılmıştır. Simetrik Kullback-Leibler uzaklığı ile konuşma ya da gürültü olma olasılığı üzerinden uyarlanır eşik değerleri belirlenmiş ve her kip için hesaplanmıştır. Gürültülü konuşma sinyallerinin içkin kip fonksiyonu katsayılarının bu uyarlanır eşik değerlerinden geçirilmesi ile konuşma ve konuşma olmayan bölgeler belirlenerek sesli etkinlik algılama gerçeklenmiştir. Konuşma iyileştirme algoritması için ise bu katsayıların uyarlanır eşik değerleri kullanılarak oluşturulan bir yarı-yumuşak eşikleme fonksiyonundan geçirilmesi ile iyileştirilmiş konuşmalar elde edilmiştir. Yöntemlerin test edilmesinde İngilizce için NOIZEUS ve Türkçe için ise ODTÜ veri tabanı kullanılmıştır. Yöntemler yedi farklı gürültü tipi ve beş farklı sinyal gürültü oranı seviyesi koşullarında değerlendirilmiştir. Önerilen sesli etkinlik algılama yöntemi; konuşma doğruluk oranı, konuşma dışı doğruluk oranı ve genel doğruluk oranı ölçütlerine göre literatürdeki yöntemlere üstünlük sağlamıştır. Benzer şekilde, önerilen konuşma iyileştirme yöntemi nesnel kalite ve anlaşılabilirlik ölçütleri ile değerlendirilmiş ve literatürde sıklıkla kullanılan diğer yöntemler ile karşılaştırılmıştır. Tüm sonuçlar göz önünde bulundurulduğunda önerilen yöntem hem gürültü azaltmada hem de anlaşılabilirliğin sağlanmasında diğer yöntemlere göre daha başarılı bulunmuştur.

Özet (Çeviri)

In this study, a new voice/speech activity detection and speech enhancement algorithms based on Gamma statistical model of the energy distribution extractred by Teager energy operator applied to intrinsic mode functions coefficients of noisy speech signals are proposed. The Gamma distribution function is used to determine the adaptive threshold values from Teager energy operated intrinsic mode function coefficients of noisy speech and estimated noise signal. Adaptive threshold values are determined and calculated for each mode based on the probability of speech or noise with Symmetric Kullback-Leibler divergence. The speech and non-speech regions are obtained by applying adaptive thresholding in these coefficients of noisy speech. For speech enhancement algorithms, the enhanced speech signals are obtained by a semi-soft thresholding function which is utilized by thresholded intrinsic mode coefficients of noisy speech. The proposed methods are tested on NOIZEUS for English and on METU for Turkish speech database and evaluated for seven kinds of noises across five different SNR levels. The proposed voice activity detection method is superior to other literature methods in terms of speech hit rate (HR1), non-speech hit rate (HR0) and overall accuracy rate. Similarly, the proposed speech enhancement method is compared to other methods frequently used in the literature in terms of objective quality and intelligibility mesaures. Simulation results show that the proposed methods are effective and outperformed to provide in terms of noise reduction and intelligibility compared with other speech enhancement methods for different SNR levels.

Benzer Tezler

  1. Meme tümörünün erken teşhisine yönelik titreşim tabanlı sistem tasarımı

    Vibration-based system design for early detection of breast tumors

    MEHMET ÜMİT AK

    Doktora

    Türkçe

    Türkçe

    2024

    Elektrik ve Elektronik MühendisliğiAkdeniz Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. SÜLEYMAN BİLGİN

  2. Rüzgâr hızındaki doğrusal olmayan dinamikler ile baş edebilen gürbüz tahmin modeli

    Robust forecasting model coping with nonlinear dynamics in wind speed

    CANER BARIŞ

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Elektrik ve Elektronik MühendisliğiZonguldak Bülent Ecevit Üniversitesi

    Elektrik ve Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. AYTAÇ ALTAN

  3. New approach for empirical mode decomposition based on double filtration process

    Çıft fıltrasyon sürecı dayalı ampırık model yarışma ıçın yenı yaklaşım

    DOAA SAMEER ABDÜLKAREEM

    Yüksek Lisans

    İngilizce

    İngilizce

    2014

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFatih Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. KADİR TUFAN

  4. Sürekli mıknatıslı senkron motorda akı sinyali kullanılarak stator sargı arızası teşhisi

    Stator winding fault diagnosis using flux signal in permanent magnet synchronous motor

    RUMEYSA SELÇUK AKSOY

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Elektrik ve Elektronik MühendisliğiTokat Gaziosmanpaşa Üniversitesi

    Elektrik ve Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ZAFER DOĞAN

  5. Assessment of features and classifiers forbluetooth rf fingerprinting

    Bluetooth sinyallerinin RF parmak izi yöntemi ile sınıflandırılmasında öznitelikler ve sınıflandırıcıların değerlendirilmesi

    AYSHA B. M. ALI AYSHA B. M. ALI

    Doktora

    İngilizce

    İngilizce

    2019

    Elektrik ve Elektronik MühendisliğiAtılım Üniversitesi

    Mühendislik Sistemlerinin Modellenmesi ve Tasarımı Ana Bilim Dalı

    PROF. DR. ALİ KARA