Geri Dön

Doğrusal öngörü ile konuşma işareti kodlayıcısı tasarımı

Design of a linear predictive speech coder

  1. Tez No: 213523
  2. Yazar: YILMAZ KIRÇİÇEK
  3. Danışmanlar: PROF. DR. VEDAT TAVŞANOĞLU
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Elektrik ve Elektronik Mühendisliği, Matematik, Computer Engineering and Computer Science and Control, Electrical and Electronics Engineering, Mathematics
  6. Anahtar Kelimeler: Model based speech coder, linear prediction, LPC, MATLAB
  7. Yıl: 2007
  8. Dil: Türkçe
  9. Üniversite: Yıldız Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Haberleşme Ana Bilim Dalı
  12. Bilim Dalı: Elektronik Bilim Dalı
  13. Sayfa Sayısı: 78

Özet

İnsan konuşma sistemi üzerine bina edilen ve matematiksel araç olarak doğrusal öngörüyü kullanan model tabanlı bir konuşma işareti kodlayıcı MATLAB programı üzerinde gerçeklenmiştir. Gerçek zamanda çalışmayan sistem, kayıtlı konuşma işaretlerini doğrusal öngörü ile kodlayarak (analiz) tanımlanan biçimleme ile .lpc uzantılı dosyaya yazar, sonra dosyayı okuyup kodu çözerek (sentez) giriş-çıkış işaretlerini kullanıcıya dinletir ve görsel animasyonlar yapar. Ses kodlayıcı 3.84 kb/s ve 2.56 kb/s olmak üzere iki veri çıkış hızında çalışabilmektedir. Testlerde Ulusal Elektronik ve Kriptoloji Araştırma Enstitüsü'nden temin edilen Turtel Kütüphanesi'nin bir alt kümesi (5 erkek 5 kadın konuşmacının 15'er cümlesi) ve 3.84 kb/s çıkış hızına sahip ses kodlayıcı kullanılmıştır. Yaş ortalamaları 31 olan 8 erkek 7 kadın katılımcı ile yapılan Mutlak Kategori Test'i sonucunda ses kodlayıcın kalitesi 3.4 olarak tespit edilmiştir. Anahtar Kelimeler : Model tabanlı ses kodlayıcı, doğrusal öngörü, LPC, MATLAB

Özet (Çeviri)

A speech coder was designed on MATLAB environment based on human speech production system that uses linear prediction as mathematical tool. System does not work in real time. It processes the recorded speech signals by coding with linear prediction (analysis), writes to a file in a predefined format with .lpc extension. Then it reads and decodes the file (synthesis), plays the input-output signal and shows some visual animations. System can work 3.84 kb/s or 2.56 kb/s data output rates. A subset of the Turtel Library (5 male and 5 female speaker, 15 sentences of each) provided by National Electronic and Cryptology Research Institute and 3.84 kb/s data rated vocoder was used in tests. Sound quality of the vocoder is defined as 3.4 with Absolute Category Rating test by participation of 8 men and 7 women audiences whose average age is 31.

Benzer Tezler

  1. Düşük bit hızında konuşma kodlama

    Low bit rate speech coding

    TOLGA AYDEMİR

    Yüksek Lisans

    Türkçe

    Türkçe

    2000

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    PROF.DR. GÜNSEL DURUSOY

  2. New methods for robust speech recognition

    Konuşma tanıma için gürültüye dayanıklı yeni yöntemler

    ENGİN ERZİN

    Yüksek Lisans

    İngilizce

    İngilizce

    1995

    Elektrik ve Elektronik Mühendisliğiİhsan Doğramacı Bilkent Üniversitesi

    DOÇ.DR. A. ENİS ÇETİN

  3. Zamanla değişen özbağlanımlı modele dayalı olarak durağan olmayan rasgele işaretlerin modellenmesi

    Modelling the nonstationary random signals based upon the time-varying autoregressive model

    SİMGE ZEREY

    Yüksek Lisans

    Türkçe

    Türkçe

    2014

    Elektrik ve Elektronik MühendisliğiPamukkale Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. AYDIN KIZILKAYA

  4. Yapay sinir ağlarında öğrenme algoritmalarının analizi

    Analysis of learning algorithms in neural networks

    SEVİNÇ BAKLAVACI