Geri Dön

Nonlinear interactive source-filter model for voiced speech

Sesli sesler için doğrusal olmayan etkileşimli kaynak-süzgeç modeli

  1. Tez No: 318872
  2. Yazar: TURGAY KOÇ
  3. Danışmanlar: PROF. TOLGA ÇİLOĞLU
  4. Tez Türü: Doktora
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2012
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 111

Özet

Doğrusal kaynak-süzgeç modeli (DKSM) Gunnar Fant tarafından önerildiği 1960 dan beri konuşma işlemede birincil model olarak kullanılmaktadır. Bu model de kaynak glottal akım ve süzgeç vokal boşluk olup bunların birbirlerinden bağımsız olduğu kabul edilir. Fakat, konuşma sisteminin fiziksel modelleri ile yapılan simülasyonlar, özellikle ses tellerinin titreşim frekansı (F0) vokal boşluğun birinci rezonans frekansına yaklaştığında, vokal boşluğun glottal akım üzerinde önemli etkileri olduğunu göstermiştir. Bu tezde klasik doğrusal kaynak-süzgeç modeline alternatif olarak sesli sesler için kaynak ve süzgecin birbirini bağlı olduğu yeni doğrusal olmayan etkileşimli kaynak-süzgeç modeli önerilmektedir. Öncelikle kaynak ve süzgecin etkileşimi için bir platform sunulmaktadır. Ardından vokal boşluktaki akustiğin doğrusal ve ses tellerindeki hava akışının durağan-benzeri Bernoulli akımı olduğu kabul edilerek, iki adet doğrusal olmayan etkileşimli kaynak-süzgeç modeli (EKSM) önerilmiştir. Bu modelde klasik modelden farklı olarak glottal alan kaynak olarak kabul edilmiş, glottal akım, glottal alan ve vokal boşluk Bernoulli denklemi ile ilişkilendirilmiştir. Teorik olarak DKSM nin bu modellerin bir yaklaşımı olduğu gösterilmiştir. Önerilen modellerin parametrelerinin sadece konuşma sinyalinden bulunması doğrusal olmayan bir ters evrişim problemidir. Bu problem konuşmanın akustik teorisinden faydalanılarak geliştirilen güçlü bir algoritma ile çözülmüştür. Yapılan deney sonuçları EKSM lerin fiziksel sistemlerde gözlenen kaynak-süzgeç etkileşimini üretebildiğini göstermiş ve aynı zamanda önerilen parametre tahmin algoritması her zaman kararlı, doğrusal modelden daha iyi doğrusal olmayan modeller üretmiştir.

Özet (Çeviri)

The linear source-filter model (LSFM) has been used as a primary model for speech processing since 1960 when G. Fant presented acoustic speech production theory. It assumes that the source of voiced speech sounds, glottal flow, is independent of the filter, vocal tract. However, acoustic simulations based on the physical speech production models show that, especially when the fundamental frequency (F0) of source harmonics approaches to the first formant frequency (F1) of vocal tract filter, the filter has significant effects on the source due to the nonlinear coupling between them. In this thesis, as an alternative to linear source-filter model, interactive nonlinear source-filter models are proposed for voiced speech. First, a framework for the coupling of the source and the filter is presented. Then two nonlinear interactive source-filter models (ISFMs) are proposed assuming that glottal flow is a quasi-steady Bernoulli flow and acoustics in the vocal tract is linear. It is theoretically shown that linear source-filter model is an approximation of the nonlinear models. Estimation of the parameters of ISMF from only speech signal is a nonlinear blind deconvolution problem. The problem is solved by a robust algorithm developed based on the acoustical interpretation of the systems. Experimental results show that ISFMs produce source-filter coupling effects seen in the physical simulations and the parameter estimation method produce always stable and better performing models than LSFM model.

Benzer Tezler

  1. Mikrofon dizilerinde ses kaynağının yerinin zaman farkı gecikmeleri kullanılarak bulunması

    Sound source localization using microphone arrays by tdoa method

    BİLGE MİNİSKER

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    Mühendislik Bilimleriİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    DOÇ. MÜRVET KIRCI

  2. Yüksek boyutlu model gösterilimi ve çok değişkenliliği yükseltilmiş çarpımlar gösterilimi ile görüntü üzerindeki gürültüleri giderme

    Image denoising via high dimensional model representation and enhanced multivariate product representation

    SENA KAÇAR

    Doktora

    Türkçe

    Türkçe

    2024

    Matematikİstanbul Teknik Üniversitesi

    Matematik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. BURCU TUNGA

  3. Engineering the nonlinear dynamics of photonic systems: Demonstration of the soliton-similariton fiber laser and nonlinear laser lithography

    Fotonik sistemlerin doğrusal olmayan dinamiklerinin yönetimi: Soliton-similariton fiber lazer ve doğrusal olmayan lazer litografisinin gösterilmesi

    BÜLENT ÖKTEM

    Doktora

    İngilizce

    İngilizce

    2013

    Bilim ve Teknolojiİhsan Doğramacı Bilkent Üniversitesi

    Malzeme Bilimi ve Nanoteknoloji Ana Bilim Dalı

    YRD. DOÇ. DR. FATİH ÖMER İLDAY

  4. Photonic crystal based spectral filter devices for optical communication

    Optik haberleşme için fotonik kristal tabanlı spektral filtre aygıtları

    ÖZGÜR ÖNDER KARAKILINÇ

    Doktora

    İngilizce

    İngilizce

    2015

    Elektrik ve Elektronik Mühendisliğiİzmir Yüksek Teknoloji Enstitüsü

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    PROF. DR. MEHMET SALİH DİNLEYİCİ

  5. Çok fazlı yükseltici tip dc-dc dönüştürücüler için dışbükey optimizasyon kullanılarak sabit dereceli gürbüz h∞ kontrolcü sentezi

    Robust fixed order h∞ controller synthesis using convex optimization for dc-dc multi phase boost converters

    RIDVAN KESKİN

    Doktora

    Türkçe

    Türkçe

    2023

    Elektrik ve Elektronik MühendisliğiZonguldak Bülent Ecevit Üniversitesi

    Elektrik ve Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. İBRAHİM ALIŞKAN

    DR. ERSİN DAŞ