Nonlinear interactive source-filter model for voiced speech

Sesli sesler için doğrusal olmayan etkileşimli kaynak-süzgeç modeli

PDF İndir

Tez No: 318872
Yazar: TURGAY KOÇ
Danışmanlar: PROF. TOLGA ÇİLOĞLU
Tez Türü: Doktora
Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
Anahtar Kelimeler: Belirtilmemiş.
Yıl: 2012
Dil: İngilizce
Üniversite: Orta Doğu Teknik Üniversitesi
Enstitü: Fen Bilimleri Enstitüsü
Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
Bilim Dalı: Belirtilmemiş.
Sayfa Sayısı: 111

Özet

Doğrusal kaynak-süzgeç modeli (DKSM) Gunnar Fant tarafından önerildiği 1960 dan beri konuşma işlemede birincil model olarak kullanılmaktadır. Bu model de kaynak glottal akım ve süzgeç vokal boşluk olup bunların birbirlerinden bağımsız olduğu kabul edilir. Fakat, konuşma sisteminin fiziksel modelleri ile yapılan simülasyonlar, özellikle ses tellerinin titreşim frekansı (F0) vokal boşluğun birinci rezonans frekansına yaklaştığında, vokal boşluğun glottal akım üzerinde önemli etkileri olduğunu göstermiştir. Bu tezde klasik doğrusal kaynak-süzgeç modeline alternatif olarak sesli sesler için kaynak ve süzgecin birbirini bağlı olduğu yeni doğrusal olmayan etkileşimli kaynak-süzgeç modeli önerilmektedir. Öncelikle kaynak ve süzgecin etkileşimi için bir platform sunulmaktadır. Ardından vokal boşluktaki akustiğin doğrusal ve ses tellerindeki hava akışının durağan-benzeri Bernoulli akımı olduğu kabul edilerek, iki adet doğrusal olmayan etkileşimli kaynak-süzgeç modeli (EKSM) önerilmiştir. Bu modelde klasik modelden farklı olarak glottal alan kaynak olarak kabul edilmiş, glottal akım, glottal alan ve vokal boşluk Bernoulli denklemi ile ilişkilendirilmiştir. Teorik olarak DKSM nin bu modellerin bir yaklaşımı olduğu gösterilmiştir. Önerilen modellerin parametrelerinin sadece konuşma sinyalinden bulunması doğrusal olmayan bir ters evrişim problemidir. Bu problem konuşmanın akustik teorisinden faydalanılarak geliştirilen güçlü bir algoritma ile çözülmüştür. Yapılan deney sonuçları EKSM lerin fiziksel sistemlerde gözlenen kaynak-süzgeç etkileşimini üretebildiğini göstermiş ve aynı zamanda önerilen parametre tahmin algoritması her zaman kararlı, doğrusal modelden daha iyi doğrusal olmayan modeller üretmiştir.

Özet (Çeviri)

The linear source-filter model (LSFM) has been used as a primary model for speech processing since 1960 when G. Fant presented acoustic speech production theory. It assumes that the source of voiced speech sounds, glottal flow, is independent of the filter, vocal tract. However, acoustic simulations based on the physical speech production models show that, especially when the fundamental frequency (F0) of source harmonics approaches to the first formant frequency (F1) of vocal tract filter, the filter has significant effects on the source due to the nonlinear coupling between them. In this thesis, as an alternative to linear source-filter model, interactive nonlinear source-filter models are proposed for voiced speech. First, a framework for the coupling of the source and the filter is presented. Then two nonlinear interactive source-filter models (ISFMs) are proposed assuming that glottal flow is a quasi-steady Bernoulli flow and acoustics in the vocal tract is linear. It is theoretically shown that linear source-filter model is an approximation of the nonlinear models. Estimation of the parameters of ISMF from only speech signal is a nonlinear blind deconvolution problem. The problem is solved by a robust algorithm developed based on the acoustical interpretation of the systems. Experimental results show that ISFMs produce source-filter coupling effects seen in the physical simulations and the parameter estimation method produce always stable and better performing models than LSFM model.

Benzer Tezler

Tez No
540281
Mikrofon dizilerinde ses kaynağının yerinin zaman farkı gecikmeleri kullanılarak bulunması
Sound source localization using microphone arrays by tdoa method
BİLGE MİNİSKER
Yüksek Lisans
Türkçe
2018
Mühendislik Bilimleri İstanbul Teknik Üniversitesi
Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
DOÇ. MÜRVET KIRCI
Tez No
900397
Yüksek boyutlu model gösterilimi ve çok değişkenliliği yükseltilmiş çarpımlar gösterilimi ile görüntü üzerindeki gürültüleri giderme
Image denoising via high dimensional model representation and enhanced multivariate product representation
SENA KAÇAR
Doktora
Türkçe
2024
Matematik İstanbul Teknik Üniversitesi
Matematik Mühendisliği Ana Bilim Dalı
DOÇ. DR. BURCU TUNGA
Tez No
336856
Engineering the nonlinear dynamics of photonic systems: Demonstration of the soliton-similariton fiber laser and nonlinear laser lithography
Fotonik sistemlerin doğrusal olmayan dinamiklerinin yönetimi: Soliton-similariton fiber lazer ve doğrusal olmayan lazer litografisinin gösterilmesi
BÜLENT ÖKTEM
Doktora
İngilizce
2013
Bilim ve Teknoloji İhsan Doğramacı Bilkent Üniversitesi
Malzeme Bilimi ve Nanoteknoloji Ana Bilim Dalı
YRD. DOÇ. DR. FATİH ÖMER İLDAY
Tez No
405206
Photonic crystal based spectral filter devices for optical communication
Optik haberleşme için fotonik kristal tabanlı spektral filtre aygıtları
ÖZGÜR ÖNDER KARAKILINÇ
Doktora
İngilizce
2015
Elektrik ve Elektronik Mühendisliği İzmir Yüksek Teknoloji Enstitüsü
Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. MEHMET SALİH DİNLEYİCİ
Tez No
823437
Çok fazlı yükseltici tip dc-dc dönüştürücüler için dışbükey optimizasyon kullanılarak sabit dereceli gürbüz h∞ kontrolcü sentezi
Robust fixed order h∞ controller synthesis using convex optimization for dc-dc multi phase boost converters
RIDVAN KESKİN
Doktora
Türkçe
2023
Elektrik ve Elektronik Mühendisliği Zonguldak Bülent Ecevit Üniversitesi
Elektrik ve Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. İBRAHİM ALIŞKAN
DR. ERSİN DAŞ

Geri Dön