Karma uyarım doğrusal öngörüm kodlaması yöntemi ile disfonik konuşmadan normal konuşma elde edilmesi
Reconstruction of normal speech from dysphonic speech by using mixed excitation linear predictive coding method
- Tez No: 238150
- Danışmanlar: YRD. DOÇ. DR. M. ELİF KARSLIGİL
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Ses Bozuklukları, Ses Değiştirme Teknikleri, Karma Uyarım, Doğrusal Öngörüm Kodlaması, Dysphony, Voice Modification Techniques, Mixed Excitation Linear Predictive Coding
- Yıl: 2008
- Dil: Türkçe
- Üniversite: Yıldız Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 71
Özet
Konuşma, günlük etkileşimin en etkin ve verimli biçimlerinden biridir. Ses telleri, gırtlak içinden geçen havanın etkisiyle titrer ve ses çıkartılmasını sağlar. Damak, dil ve dudakların hareketiyle ses şekillendirilir ve konuşma halini alır. Oluşan sesin şiddetini akciğerler tarafından oluşturulan subglottik basıncın büyüklüğü belirler. Ses tellerinin gerginliğinin, şeklinin ve ses tellerine gelen hava basıncının değişmesiyle ses farklı şekillerde çıkar. Ses bozuklukları, gerek sinirsel, gerek yapısal, gerekse de ses telleri üzerinde oluşan patolojiler nedeniyle, konuşma için gırtlaktan çıkardığımız sesin tizliği, yüksekliği ve kalitesinde meydana gelen istenmedik değişikliklerdir.Sesini tamamen kaybetmiş hastalar için elektro gırtlak ya da ses protezi gibi tıbbi ve mekanik çözümler önerilmiştir. Ancak bu teknikler enfeksiyon riski taşıyabilmekte ya da üretilen ses kalitesiz olabilmektedir. Bu tekniklerle üretilmiş seslerin kalitesinin yükseltilmesine yönelik çalışmalar son 15 yılda hızlanmış ve birçok sistem tasarlanmıştır. Ancak literatürde bu tekniklere alternatif olarak kullanılabilecek doyurucu bir çalışma mevcut değildir. Bu çalışmada, konuşma yeteneğini tamamen kaybetmiş hastalar için ses protezi gibi kullanılabilecek yazılım tabanlı bir sistem tasarlanmış ve gerçeklenmiştir.Tasarlanan sistemde, iyileştirilmiş konuşmanın sentezi için KUDÖK (Karma Uyarımlı Doğrusal Öngörüm Kodlaması, MELP) kullanılmıştır. Disfonik konuşma için ötümsüz sessiz içeren çerçeveler tespit edilmiş ve bu çerçeveler dışındaki çerçeveler için formant frekansları ve perde bağlantısı kullanılarak perde oluşturulmuş, formant yapısı değişikliği yapılmış ve seslilik eklenmiştir. Perde üretimi için perde-formant frekansı ilişkisinden yararlanılmıştır.Geliştirilen sistem ile elde edilen sentetik sesin kalitesinin incelenmesi için spektral uzaklık hesabı yapılmış ve öznel dinleyici testlerine başvurulmuştur. Testler sonunda sentetik sesin disfonik sese göre normal sese yaklaşık %20 oranında daha yakın olduğu saptanmıştır. İleriki çalışmalarda sentetik ses kalitesinin arttırılması ve gerçek zamanlı bir gömülü sistem uygulaması haline getirilmesi ile sesini tamamen kaybetmiş hastaların yeniden etkin sesli iletişim kurabilmelerine yardımcı olacak alternatif bir metod geliştirilebilir.
Özet (Çeviri)
Speech is one of the best effective ways of daily communication. While producing voice, vocal cords vibrate when air is forced through them and along the vocal tract. Voice shaped by palate, tongue and lips and gets form to speech. The intensity of the voice depends on the subglottic pressure produced by lungs. Voice can be adjusted by varying the shape and the tension in the vocal cords, and the pressure of the air behind them. Dysphony is the result of the neural, structural or pathological effects on the vocal cords or larynx and it causes undesirable changes in the pitch, amplitude and the quality of the speech.Medical and mechanical solutions like electrolarynx and voice prosthesis are proposed for the patients who have lost ability to speak. However, these techniques have infection risk or are poor quality. Although studies about enhancing the speech that is produced by these techniques have begun to be seen in the literature for 15 years, there is not a comprehensive study on alternative solution of medical and mechanical techniques. The proposed system in this thesis can be used as speech prosthesis for the dysphony patients.In the proposed system, MELP (Mixed Excitation Linear Predictive Coding) was used for synthesizing enhanced speech. Unvoiced phonemes were detected for dysphonic speech. Pitch and voicing were produced, formant modification was applied for the phonemes except unvoiced phonemes. Correlation between pitch and formant frequencies was used in order to produce pitch.Spectral distance was calculated and subjective listening tests were applied in order to discuss the synthetic speech quality. It is observed that similarity between synthetic speech and normal speech is %20 higher compared to the similarity between dysphonic speech and normal speech. In the future, an alternative method that can help patients who are lack of ability to communicate effectively can be developed by increasing the synthetic speech quality and constructing a real time embedded system.
Benzer Tezler
- Karma uyarım doğrusal öngörüm (KUDÖ) kodlamasının çeşitli parametrelerinin kodlama başarımına etkisinin incelenmesi
Investigation of various parameters of mixed excitation linear prediction (MELP) coder on the coding performance
MURAT ŞAHİN
Yüksek Lisans
Türkçe
2004
Elektrik ve Elektronik MühendisliğiHacettepe ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
Y.DOÇ.DR. SEMİH BİNGÖL
- Code excited linear predictive coding of speech wing source-filter interrelation extracted by self organising maps
Kaynak-süzgeç ilişkisinin kendinden düzenlemeli haritalarda kullanılması ile kod uyarımlı doğrusal öngörü kodlayıcılarının niteliğinin artırılması
GÖKHAN AVKAROĞULLARI
Yüksek Lisans
İngilizce
1998
Elektrik ve Elektronik MühendisliğiOrta Doğu Teknik ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. TOLGA ÇİLOĞLU
- Duyusal uyarım sisteminin tasarımı ve uygulaması
Design and application of tactile stimulator system
COŞKUN KAZMA
Doktora
Türkçe
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. NİZAMETTİN AYDIN
- Body roll control of a lightweight military ground vehicle under recoil impulse using gyrostabilizers
Hafifletilmiş askeri kara aracında silah kaynaklı yalpa hareketinin jiroskopik dengeleyiciler ile kontrol edilmesi
AHMET FURKAN EKİNCİ
Yüksek Lisans
İngilizce
2023
Savunma ve Savunma Teknolojileriİstanbul Teknik ÜniversitesiMakine Mühendisliği Ana Bilim Dalı
DOÇ. DR. OSMAN TAHA ŞEN
- A new hybrid composite isolation system for earthquake protection of structures
Yapıların deprem koruma için yeni bir hibrit kompozit izolasyon sistemi
SALAH MUSTAFA A.ALMUSBAHI
Doktora
İngilizce
2019
Metalurji MühendisliğiKarabük ÜniversitesiMetalurji ve Malzeme Mühendisliği Ana Bilim Dalı
PROF. DR. ALİ GÜNGÖR