Geri Dön

Karma uyarım doğrusal öngörüm kodlaması yöntemi ile disfonik konuşmadan normal konuşma elde edilmesi

Reconstruction of normal speech from dysphonic speech by using mixed excitation linear predictive coding method

  1. Tez No: 238150
  2. Yazar: H. İREM TÜRKMEN
  3. Danışmanlar: YRD. DOÇ. DR. M. ELİF KARSLIGİL
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Ses Bozuklukları, Ses Değiştirme Teknikleri, Karma Uyarım, Doğrusal Öngörüm Kodlaması, Dysphony, Voice Modification Techniques, Mixed Excitation Linear Predictive Coding
  7. Yıl: 2008
  8. Dil: Türkçe
  9. Üniversite: Yıldız Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 71

Özet

Konuşma, günlük etkileşimin en etkin ve verimli biçimlerinden biridir. Ses telleri, gırtlak içinden geçen havanın etkisiyle titrer ve ses çıkartılmasını sağlar. Damak, dil ve dudakların hareketiyle ses şekillendirilir ve konuşma halini alır. Oluşan sesin şiddetini akciğerler tarafından oluşturulan subglottik basıncın büyüklüğü belirler. Ses tellerinin gerginliğinin, şeklinin ve ses tellerine gelen hava basıncının değişmesiyle ses farklı şekillerde çıkar. Ses bozuklukları, gerek sinirsel, gerek yapısal, gerekse de ses telleri üzerinde oluşan patolojiler nedeniyle, konuşma için gırtlaktan çıkardığımız sesin tizliği, yüksekliği ve kalitesinde meydana gelen istenmedik değişikliklerdir.Sesini tamamen kaybetmiş hastalar için elektro gırtlak ya da ses protezi gibi tıbbi ve mekanik çözümler önerilmiştir. Ancak bu teknikler enfeksiyon riski taşıyabilmekte ya da üretilen ses kalitesiz olabilmektedir. Bu tekniklerle üretilmiş seslerin kalitesinin yükseltilmesine yönelik çalışmalar son 15 yılda hızlanmış ve birçok sistem tasarlanmıştır. Ancak literatürde bu tekniklere alternatif olarak kullanılabilecek doyurucu bir çalışma mevcut değildir. Bu çalışmada, konuşma yeteneğini tamamen kaybetmiş hastalar için ses protezi gibi kullanılabilecek yazılım tabanlı bir sistem tasarlanmış ve gerçeklenmiştir.Tasarlanan sistemde, iyileştirilmiş konuşmanın sentezi için KUDÖK (Karma Uyarımlı Doğrusal Öngörüm Kodlaması, MELP) kullanılmıştır. Disfonik konuşma için ötümsüz sessiz içeren çerçeveler tespit edilmiş ve bu çerçeveler dışındaki çerçeveler için formant frekansları ve perde bağlantısı kullanılarak perde oluşturulmuş, formant yapısı değişikliği yapılmış ve seslilik eklenmiştir. Perde üretimi için perde-formant frekansı ilişkisinden yararlanılmıştır.Geliştirilen sistem ile elde edilen sentetik sesin kalitesinin incelenmesi için spektral uzaklık hesabı yapılmış ve öznel dinleyici testlerine başvurulmuştur. Testler sonunda sentetik sesin disfonik sese göre normal sese yaklaşık %20 oranında daha yakın olduğu saptanmıştır. İleriki çalışmalarda sentetik ses kalitesinin arttırılması ve gerçek zamanlı bir gömülü sistem uygulaması haline getirilmesi ile sesini tamamen kaybetmiş hastaların yeniden etkin sesli iletişim kurabilmelerine yardımcı olacak alternatif bir metod geliştirilebilir.

Özet (Çeviri)

Speech is one of the best effective ways of daily communication. While producing voice, vocal cords vibrate when air is forced through them and along the vocal tract. Voice shaped by palate, tongue and lips and gets form to speech. The intensity of the voice depends on the subglottic pressure produced by lungs. Voice can be adjusted by varying the shape and the tension in the vocal cords, and the pressure of the air behind them. Dysphony is the result of the neural, structural or pathological effects on the vocal cords or larynx and it causes undesirable changes in the pitch, amplitude and the quality of the speech.Medical and mechanical solutions like electrolarynx and voice prosthesis are proposed for the patients who have lost ability to speak. However, these techniques have infection risk or are poor quality. Although studies about enhancing the speech that is produced by these techniques have begun to be seen in the literature for 15 years, there is not a comprehensive study on alternative solution of medical and mechanical techniques. The proposed system in this thesis can be used as speech prosthesis for the dysphony patients.In the proposed system, MELP (Mixed Excitation Linear Predictive Coding) was used for synthesizing enhanced speech. Unvoiced phonemes were detected for dysphonic speech. Pitch and voicing were produced, formant modification was applied for the phonemes except unvoiced phonemes. Correlation between pitch and formant frequencies was used in order to produce pitch.Spectral distance was calculated and subjective listening tests were applied in order to discuss the synthetic speech quality. It is observed that similarity between synthetic speech and normal speech is %20 higher compared to the similarity between dysphonic speech and normal speech. In the future, an alternative method that can help patients who are lack of ability to communicate effectively can be developed by increasing the synthetic speech quality and constructing a real time embedded system.

Benzer Tezler

  1. Karma uyarım doğrusal öngörüm (KUDÖ) kodlamasının çeşitli parametrelerinin kodlama başarımına etkisinin incelenmesi

    Investigation of various parameters of mixed excitation linear prediction (MELP) coder on the coding performance

    MURAT ŞAHİN

    Yüksek Lisans

    Türkçe

    Türkçe

    2004

    Elektrik ve Elektronik MühendisliğiHacettepe Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    Y.DOÇ.DR. SEMİH BİNGÖL

  2. Code excited linear predictive coding of speech wing source-filter interrelation extracted by self organising maps

    Kaynak-süzgeç ilişkisinin kendinden düzenlemeli haritalarda kullanılması ile kod uyarımlı doğrusal öngörü kodlayıcılarının niteliğinin artırılması

    GÖKHAN AVKAROĞULLARI

    Yüksek Lisans

    İngilizce

    İngilizce

    1998

    Elektrik ve Elektronik MühendisliğiOrta Doğu Teknik Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. TOLGA ÇİLOĞLU

  3. Duyusal uyarım sisteminin tasarımı ve uygulaması

    Design and application of tactile stimulator system

    COŞKUN KAZMA

    Doktora

    Türkçe

    Türkçe

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. NİZAMETTİN AYDIN

  4. Body roll control of a lightweight military ground vehicle under recoil impulse using gyrostabilizers

    Hafifletilmiş askeri kara aracında silah kaynaklı yalpa hareketinin jiroskopik dengeleyiciler ile kontrol edilmesi

    AHMET FURKAN EKİNCİ

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Savunma ve Savunma Teknolojileriİstanbul Teknik Üniversitesi

    Makine Mühendisliği Ana Bilim Dalı

    DOÇ. DR. OSMAN TAHA ŞEN

  5. A new hybrid composite isolation system for earthquake protection of structures

    Yapıların deprem koruma için yeni bir hibrit kompozit izolasyon sistemi

    SALAH MUSTAFA A.ALMUSBAHI

    Doktora

    İngilizce

    İngilizce

    2019

    Metalurji MühendisliğiKarabük Üniversitesi

    Metalurji ve Malzeme Mühendisliği Ana Bilim Dalı

    PROF. DR. ALİ GÜNGÖR