Geri Dön

Enhancement of throat microphone recordings using gaussian mixture model probabilistic estimator

Gırtlak mikrofonu kayıtlarının gauss karışım modeli aracılığıyla iyileştirilmesi

  1. Tez No: 332230
  2. Yazar: MEHMET ALİ TUĞTEKİN TURAN
  3. Danışmanlar: DOÇ. DR. ENGİN ERZİN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2013
  8. Dil: İngilizce
  9. Üniversite: Koç Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 53

Özet

Gırtlak mikrofonu, ses tellerindeki titreşimi gırtlaktan gelen sinyallerle beraber ileten ve kullanan kişinin boynuna taktığı insan bedeniyle temas eden bir mikrofon türüdür. Bu bağlantı sayesinde, titreşimleri havadan alan akustik mikrofonlara nazaran gürültü gibi çevresel etmenlere karşı daha gürbüz bir iletişim sağlar. Gırtlak mikrofonu ile kaydedilen sesler kısmen de olsa anlaşılmasına rağmen, doğal olmayan ve kulağı rahatsız edici bir yapıdadır. İşte bu çalışma gırtlak mikrofonlarındaki üretilemeyen frekans aralıklarını geri kazanabilmeyi amaçlarken aynı zamanda sesin kaynak ve süzgeç kısımlarını doğru tahmin edebilme sorununu, gırtlak ve akustik kayıtları müşterek bir şekilde çözümleyerek irdelemektedir. Bu bağlamda, ortalama kare hatasınıen aza indirerek, ses birimlerine bağlı Gauss karışım modeli tabanlı bir kestirici sistemi öne sürülmüştür. Kaynak-süzgeç ayrıştırması çerçevesinde, gırtlak ve akustik süzgecinin görüngesel farklılıklarının, gırtlak mikrofonundan gelen ses kalitesini düşüren önemli bir etmen olduğunu gözlemledik. Bu sebepten ötürü, yukarıda bahsedilen farkı görüngesel eğim vektörü olarak modelleyip, gırtlak süzgecini iyileştirici bir sistemi ayrıca öne sürdük. Ortaya konulan sistemlerin katkılarını yorumlayabilmek için hem nesnel hem de öznel deneyler tasarladık. Nesnel deneyler, logaritmik görünge tahribatı ve ses kalitesinin algısal değerlendirilmesi kıstasları üzerinden incelendiler. Bununla birlikte, öznel değerlendirmeler ise A/B eş karşılaştırma deneyi şeklinde tatbik edildi. Hem nesnel hem de öznel deneyler gösterdi ki öne sürülen ses birimi tabanlı kestirimler, halihazırda bulunan Gauss karışım modeli tabanlı kestirimlere göre tutarlı bir şekilde iyileştirmeler sağlamaktadır.

Özet (Çeviri)

The throat microphone is a body-attached transducer that is worn against the neck. It captures the signals that are transmitted through the vocal folds, along with the buzz tone of the larynx. Due to its skin contact, it is more robust to the environmental noise compared to the acoustic microphone that picks up the vibrations through air pressure, and hence the all interventions. The throat speech is partly intelligible, but gives unnatural and croaky sound. This thesis tries to recover missing frequency bands of the throat speech and investigates envelope and excitation mapping problem with joint analysis of throat- and acoustic-microphone recordings. A new phone-dependent GMM-based spectral envelope mapping scheme, which performs the minimum mean square error (MMSE) estimation of the acoustic-microphone spectral envelope, has been proposed. In the source-filter decomposition framework, we observed that the spectral envelope difference of the excitation signals of throat- and acoustic-microphone recordings is an important source of the degradation in the throat-microphone voice quality. Thus, we also model spectral envelope difference of the excitation signals as a spectral tilt vector, and propose a new phone-dependent GMM-based spectral tilt mapping scheme to enhance throat excitation signal. Experimental evaluations are performed to compare the proposed mapping scheme using both objective and subjective evaluations. Objective evaluations are performed with the log-spectral distortion (LSD) and the wide-band perceptual evaluation of speech quality (PESQ) metrics. Subjective evaluations are performed with A/B pair comparison listening test. Both objective and subjective evaluations yield that the proposed phone-dependent mapping consistently improves performances over the state-of-the-art GMM estimators.

Benzer Tezler

  1. Kolesteatom tanısında ekoplanardiffüzyon mrı

    Ecoplications in the diagnosis of cholestetomadiffusion mri

    EMİNE BALKAN

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2010

    Kulak Burun ve BoğazSağlık Bakanlığı

    Radyodiagnostik Ana Bilim Dalı

    UZMAN SUZAN DENİZ ÖNOL

  2. İnternal akustik kanal MR taramalarının incelemesi sonucu saptanan insidental bulgular

    Incidental findings on internal acoustic canal MRI scan

    NEBİL EKER

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2018

    Radyoloji ve Nükleer TıpÇanakkale Onsekiz Mart Üniversitesi

    Radyoloji Ana Bilim Dalı

    DOÇ. DR. OZAN KARATAĞ

  3. MEMS ile entegre mikro ısıtıcı ve IDE mikro sistemlerin fabrikasyonu ve nano kompozit yarı iletken gaz sensör uygulaması

    Fabrication of integrated micro heater and ide micro systems with MEMS and application of nano composite semiconductor GAS sensor

    HALİME İLBEYİİLİNGİ

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Fizik ve Fizik Mühendisliğiİstanbul Teknik Üniversitesi

    Fizik Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ BERNA MOROVA

    DOÇ. DR. CİHAT TAŞALTIN

  4. Design and performance analysis of double-flux supersonic air ejector

    Çift akılı sesüstü hava ejektör sisteminin tasarım ve performans analizi

    BERK BOZKIR

    Yüksek Lisans

    İngilizce

    İngilizce

    2018

    Havacılık MühendisliğiOrta Doğu Teknik Üniversitesi

    Havacılık ve Uzay Mühendisliği Ana Bilim Dalı

    PROF. DR. HÜSEYİN NAFİZ ALEMDAROĞLU

  5. Endonazal anatomi ve patolojilerde endoskopik görüntü kuvvetlendirilmesinin kalitatif ve kantitatif değerlendirilmesi

    Quantitative and qualitative analysis of endoscopic image enhancement on endonasal anatomy and pathologies

    SELÇUK MÜLAZİMOĞLU

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2016

    Kulak Burun ve BoğazAnkara Üniversitesi

    Kulak Burun Boğaz Ana Bilim Dalı

    PROF. DR. RAUF YÜCEL ANADOLU