Doğrusal öngörü ile konuşma işareti kodlayıcısı tasarımı
Design of a linear predictive speech coder
- Tez No: 213523
- Danışmanlar: PROF. DR. VEDAT TAVŞANOĞLU
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Elektrik ve Elektronik Mühendisliği, Matematik, Computer Engineering and Computer Science and Control, Electrical and Electronics Engineering, Mathematics
- Anahtar Kelimeler: Model based speech coder, linear prediction, LPC, MATLAB
- Yıl: 2007
- Dil: Türkçe
- Üniversite: Yıldız Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Haberleşme Ana Bilim Dalı
- Bilim Dalı: Elektronik Bilim Dalı
- Sayfa Sayısı: 78
Özet
İnsan konuşma sistemi üzerine bina edilen ve matematiksel araç olarak doğrusal öngörüyü kullanan model tabanlı bir konuşma işareti kodlayıcı MATLAB programı üzerinde gerçeklenmiştir. Gerçek zamanda çalışmayan sistem, kayıtlı konuşma işaretlerini doğrusal öngörü ile kodlayarak (analiz) tanımlanan biçimleme ile .lpc uzantılı dosyaya yazar, sonra dosyayı okuyup kodu çözerek (sentez) giriş-çıkış işaretlerini kullanıcıya dinletir ve görsel animasyonlar yapar. Ses kodlayıcı 3.84 kb/s ve 2.56 kb/s olmak üzere iki veri çıkış hızında çalışabilmektedir. Testlerde Ulusal Elektronik ve Kriptoloji Araştırma Enstitüsü'nden temin edilen Turtel Kütüphanesi'nin bir alt kümesi (5 erkek 5 kadın konuşmacının 15'er cümlesi) ve 3.84 kb/s çıkış hızına sahip ses kodlayıcı kullanılmıştır. Yaş ortalamaları 31 olan 8 erkek 7 kadın katılımcı ile yapılan Mutlak Kategori Test'i sonucunda ses kodlayıcın kalitesi 3.4 olarak tespit edilmiştir. Anahtar Kelimeler : Model tabanlı ses kodlayıcı, doğrusal öngörü, LPC, MATLAB
Özet (Çeviri)
A speech coder was designed on MATLAB environment based on human speech production system that uses linear prediction as mathematical tool. System does not work in real time. It processes the recorded speech signals by coding with linear prediction (analysis), writes to a file in a predefined format with .lpc extension. Then it reads and decodes the file (synthesis), plays the input-output signal and shows some visual animations. System can work 3.84 kb/s or 2.56 kb/s data output rates. A subset of the Turtel Library (5 male and 5 female speaker, 15 sentences of each) provided by National Electronic and Cryptology Research Institute and 3.84 kb/s data rated vocoder was used in tests. Sound quality of the vocoder is defined as 3.4 with Absolute Category Rating test by participation of 8 men and 7 women audiences whose average age is 31.
Benzer Tezler
- Düşük bit hızında konuşma kodlama
Low bit rate speech coding
TOLGA AYDEMİR
Yüksek Lisans
Türkçe
2000
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiPROF.DR. GÜNSEL DURUSOY
- New methods for robust speech recognition
Konuşma tanıma için gürültüye dayanıklı yeni yöntemler
ENGİN ERZİN
Yüksek Lisans
İngilizce
1995
Elektrik ve Elektronik Mühendisliğiİhsan Doğramacı Bilkent ÜniversitesiDOÇ.DR. A. ENİS ÇETİN
- Speech recognition based on pattern comparison techniques
Başlık çevirisi yok
OSMAN MERAL
Yüksek Lisans
İngilizce
1996
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiDOÇ.DR. BÜLENT ÖRENCİK
- Zamanla değişen özbağlanımlı modele dayalı olarak durağan olmayan rasgele işaretlerin modellenmesi
Modelling the nonstationary random signals based upon the time-varying autoregressive model
SİMGE ZEREY
Yüksek Lisans
Türkçe
2014
Elektrik ve Elektronik MühendisliğiPamukkale ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. AYDIN KIZILKAYA
- Yapay sinir ağlarında öğrenme algoritmalarının analizi
Analysis of learning algorithms in neural networks
SEVİNÇ BAKLAVACI
Yüksek Lisans
Türkçe
1994
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiDOÇ.DR. LEYLA GÖREN