Doğrusal öngörü ile konuşma işareti kodlayıcısı tasarımı

Design of a linear predictive speech coder

PDF İndir

Tez No: 213523
Yazar: YILMAZ KIRÇİÇEK
Danışmanlar: PROF. DR. VEDAT TAVŞANOĞLU
Tez Türü: Yüksek Lisans
Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Elektrik ve Elektronik Mühendisliği, Matematik, Computer Engineering and Computer Science and Control, Electrical and Electronics Engineering, Mathematics
Anahtar Kelimeler: Model based speech coder, linear prediction, LPC, MATLAB
Yıl: 2007
Dil: Türkçe
Üniversite: Yıldız Teknik Üniversitesi
Enstitü: Fen Bilimleri Enstitüsü
Ana Bilim Dalı: Haberleşme Ana Bilim Dalı
Bilim Dalı: Elektronik Bilim Dalı
Sayfa Sayısı: 78

Özet

İnsan konuşma sistemi üzerine bina edilen ve matematiksel araç olarak doğrusal öngörüyü kullanan model tabanlı bir konuşma işareti kodlayıcı MATLAB programı üzerinde gerçeklenmiştir. Gerçek zamanda çalışmayan sistem, kayıtlı konuşma işaretlerini doğrusal öngörü ile kodlayarak (analiz) tanımlanan biçimleme ile .lpc uzantılı dosyaya yazar, sonra dosyayı okuyup kodu çözerek (sentez) giriş-çıkış işaretlerini kullanıcıya dinletir ve görsel animasyonlar yapar. Ses kodlayıcı 3.84 kb/s ve 2.56 kb/s olmak üzere iki veri çıkış hızında çalışabilmektedir. Testlerde Ulusal Elektronik ve Kriptoloji Araştırma Enstitüsü'nden temin edilen Turtel Kütüphanesi'nin bir alt kümesi (5 erkek 5 kadın konuşmacının 15'er cümlesi) ve 3.84 kb/s çıkış hızına sahip ses kodlayıcı kullanılmıştır. Yaş ortalamaları 31 olan 8 erkek 7 kadın katılımcı ile yapılan Mutlak Kategori Test'i sonucunda ses kodlayıcın kalitesi 3.4 olarak tespit edilmiştir. Anahtar Kelimeler : Model tabanlı ses kodlayıcı, doğrusal öngörü, LPC, MATLAB

Özet (Çeviri)

A speech coder was designed on MATLAB environment based on human speech production system that uses linear prediction as mathematical tool. System does not work in real time. It processes the recorded speech signals by coding with linear prediction (analysis), writes to a file in a predefined format with .lpc extension. Then it reads and decodes the file (synthesis), plays the input-output signal and shows some visual animations. System can work 3.84 kb/s or 2.56 kb/s data output rates. A subset of the Turtel Library (5 male and 5 female speaker, 15 sentences of each) provided by National Electronic and Cryptology Research Institute and 3.84 kb/s data rated vocoder was used in tests. Sound quality of the vocoder is defined as 3.4 with Absolute Category Rating test by participation of 8 men and 7 women audiences whose average age is 31.

Benzer Tezler

Tez No
101200
Düşük bit hızında konuşma kodlama
Low bit rate speech coding
TOLGA AYDEMİR
Yüksek Lisans
Türkçe
2000
Elektrik ve Elektronik Mühendisliği İstanbul Teknik Üniversitesi
PROF.DR. GÜNSEL DURUSOY
Tez No
46038
New methods for robust speech recognition
Konuşma tanıma için gürültüye dayanıklı yeni yöntemler
ENGİN ERZİN
Yüksek Lisans
İngilizce
1995
Elektrik ve Elektronik Mühendisliği İhsan Doğramacı Bilkent Üniversitesi
DOÇ.DR. A. ENİS ÇETİN
Tez No
55509
Speech recognition based on pattern comparison techniques
Başlık çevirisi yok
OSMAN MERAL
Yüksek Lisans
İngilizce
1996
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol İstanbul Teknik Üniversitesi
DOÇ.DR. BÜLENT ÖRENCİK
Tez No
409990
Zamanla değişen özbağlanımlı modele dayalı olarak durağan olmayan rasgele işaretlerin modellenmesi
Modelling the nonstationary random signals based upon the time-varying autoregressive model
SİMGE ZEREY
Yüksek Lisans
Türkçe
2014
Elektrik ve Elektronik Mühendisliği Pamukkale Üniversitesi
Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. AYDIN KIZILKAYA
Tez No
39286
Yapay sinir ağlarında öğrenme algoritmalarının analizi
Analysis of learning algorithms in neural networks
SEVİNÇ BAKLAVACI
Yüksek Lisans
Türkçe
1994
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol İstanbul Teknik Üniversitesi
DOÇ.DR. LEYLA GÖREN

Geri Dön