Düşük bit hızında konuşma kodlama
Low bit rate speech coding
- Tez No: 101200
- Danışmanlar: PROF.DR. GÜNSEL DURUSOY
- Tez Türü: Yüksek Lisans
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2000
- Dil: Türkçe
- Üniversite: İstanbul Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Belirtilmemiş.
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 66
Özet
DUŞUK BİT HIZINDA KONUŞMA KODLAMA ÖZET Konuşma kodlayıcılar bîfçölrlconuşma iletim ve depolama sistemleri için kritiktir. Bu alanda uluslararası standartların ortaya çıkması ile birlikte karşılıklı çalışan sistemler geliştirmek mümkün olmuştur. Konuşma kodlayıcılann kalitesi yüksek kaliteden anlaşılabilir kaliteye kadar değişir. Son zamanlarda 4.8 kbit/sn bit hızında yüksek kalitede konuşma ileten, kod ile uyarılan doğrusal öngörü (CELP) tekniğini esas alan yeni bir standart geliştirilmiştir. Ancak bu sistemleri geliştirmek için gereken zaman ve çaba yüzünden bu yeni kodlama standartlarına uygun ürünlerin ortaya çıkması gecikmiştir. Bu tez çalışmasının amacı bir sayısal işaret işlemci kullanarak gerçek zamanda düşük bit hızında konuşma kodlayan bir yazılım geliştirmektir. Sabit noktalı sayısal bir işaret işlemci kullanılarak C bilinde bir uygulama yazılımı yazılmış ve denenmiştir. Ayrıca etkin DSP programlama teknikleri kullanılarak gerekli olan toplam işlemci yükü 50 MlPS'in altına indirilmiştir. CELP kodlayıcılar ilk olarak AT AL ve Schoeder tarafından 1984 yılında ortaya atılmıştır. Bu kodlayıcılar düşük bit hızlarında yüksek konuşma kalitesi sunarken, yüksek bir hesaplama yükü getirmişlerdir. Bu önerilen sistemin gerçeklenmesi için mikroişlemcinin saniyede birkaç yüz milyon komut işletebilir olması gerekir. CELP üzerine yapılan pek çok çalışma bu teknik zorluğu aşmak ve hesaplamaları kolaylaştırmak yönündedir. CELP kodlama çerçeve tabanlı bir tekniktir. Giriş konuşma işareti örnekleri, örnek bloklarına bölünerek bütün olarak işlenir. CELP kodlama doğrusal öngörü, vektör nicemleme ve sentezleyerek analiz yöntemlerini esas alır. Konuşma işaretinin kısa dönemli durumu veya yapışım 10. dereceden doğrusal öngörü filtresiyle modellenir. Konuşma işaretindeki uzun dönemli tekrarlama ise (darbe tekrarlaması) adaptif kod kitabıyla modellenir. Kısa dönemli öngörü ve darbe bileşenlerinden kalan hata ise işareti stotastik kod kitabı kullanılarak kodlanır. Adaptif ve stokastik kod kitaplarından en uygun uyarma vektörü, insan işitme sisteminin özelliklerini de göz önüne alarak, hesaplanmış hata miktarını en aza indirgeyecek şekilde seçilir. CELP kodlamanın hesap yükünün büyük bölümünü adaptif ve stokastik kod kitabı aramaları oluşturur. Kodlayıcınm hesap karmaşıklığı ve konuşma işareti kalitesi kod kitaplarının boyutu ile orantılıdır. Kod kitaplarının her alt kümesi de işlemci hesaplama sınırım aşmayacak şekilde kaliteden ödün verilerek seçilebilir. vıııFed-Std-1016, 8KHz örnekleme frekansı ve dört 7.5msan'lik alt çerçeveden oluşan tek bir 30msan'lik çerçeve kullanır. CELP analizi 3 temel fonksiyondan oluşur : 1) Kısa dönemli öngörü 2) Uzun dönemli adaptif kod kitabı araması 3) Stokastik kod kitabı araması. CELP sentezi ise bu iki uyarmanın (adaptif kod kitabı ve stokastik kod kitabı) öngörü parametreleri verilen bir lineer filtreye uygulanmasıyla elde edilir. Ayrıca elde edilen çıkış bir postfiltreye uygulanarak ses kalitesi yükseltilir. Sentezleyici veya alıcı tarafından alman CELP parametreleri stokastik kod kitabı indeksi ve kazancı, adaptif kod kitabı indeksi ve kazancı ile 10 adet spektral parametre (LSP) yollanır. ıx
Özet (Çeviri)
LOW BIT RATE SPEECH CODING SUMMARY Speech coders are critical to marry^^peech transmission and store and forward systems. With the emergence of universal standards, it is possible to develop systems that are interoperable. Quality and bit rate for speech coders vary from toll quality to intelligible quality. Recently, a new standard for 4.8 kbps with near toll-quality has been proposed and is based on code-excited lineer prediction (CELP) techniques. Unfortunately, products based on new coding algorithms are often slow to appear because of the considerable time and effort required to develop real-time implementations. The purpose of this thesis is to demonstrade how a CELP coder based on this standard can be developped using a fixed point DSP. An application software was written in C language using a fixed point DSP. It was used some DSP programming techniques to use the CPU power more efficient. The required CPU power for this application software was reduced under 50 MIPS using these technics. CELP coders were first introduced by ATAL and Schoeder in 1984. These coders offer high quality at low bit rates, but a high computational cost. Implementing the original systems directly required several hundred million instructions per second (MIPS) Much of the research on CELP technics has concentrated on reducing this computational load to facilitate real-time implementations. CELP coding is a frame-oriented technique that breaks a sampled input signal into blocks of samples (i.e., vectors) that are processed as one unit. CELP coding is based on analysis-by-synthesis search procedures, perceptually weighted vector quantization (VQ), and linear prediction (LP). A 10th order LP filter is used to model the speech signal's short-term spectrum, or formant structure. Long-term signal periodicity, or pitch, is modeled by an adaptive code book VQ. The residual from the short-term LP and pitch VQ is vector quantized using a fixed stochastic code book. The optimal scaled excitation vectors from the adaptive and stochastic code books are selected by minimizing a time varying, perceptually weighted distortion measure that improves subjective speech quality by exploiting masking properties of human hearing. The CELP coder's computational requirements are dominated by the two code book searches. The computational complexity and speech quality of the coder dependupon the search sizes of the code books. Any subset of either code book can be searched to fit processor constraints, at the expense of speech quality. Fed-Std-1016 uses an 8 kHz sample rate and a 30 ms frame size with four 7.5 ms subframes. CELPanarysis^onsists of three basic functions: 1 ) Short-term linear prediction, 2) Long-term adaptive code book search, and 3) Innovation stochastic code book search. CELP synthesis consists of the corresponding three synthesis functions performed in reverse order with the optional addition of a fourth function, called a postfilter, to en hance the output speech. The transmitted CELP parameters are the stochastic code book index and gain, the adaptive code book index and gain, and 10 line spectral parameters (LSP). XI
Benzer Tezler
- 1200 bit/ sn hızlı bir düşük bit hızlı konuşma kodlayıcı tasarımı
Implementation of a 1200 bps low bit rate speech coding algorithm
SELMA ÖZAYDIN
Doktora
Türkçe
2001
Elektrik ve Elektronik MühendisliğiGazi ÜniversitesiElektrik ve Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. BUYURMAN BAYKAL
- Sinüs modeli ile düşük bit hızlarında konuşma kodlama
Speech coding at low bit rates using the sinusodial model
GÜRHAN BULU
Yüksek Lisans
Türkçe
2001
Elektrik ve Elektronik MühendisliğiHacettepe ÜniversitesiElektrik ve Elektronik Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. A. SEMİH BİNGÖL
- Düşük veri hızında çalışan genel amaçlı bir ses kodlayıcısının tasarımı
Computer simulation of a voice coder which obtains communication quality at a recuded bit rate
SERDAR TUĞAÇ
Yüksek Lisans
Türkçe
2001
Elektrik ve Elektronik MühendisliğiAnkara ÜniversitesiElektronik Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. HAKKI GÖKHAN İLK
- Implementation of a low bit rate video codec
Çok düşük bit hızlı bir video codec uygulaması
ERDAL ÖRÜKLÜ
Yüksek Lisans
İngilizce
1999
Elektrik ve Elektronik MühendisliğiBoğaziçi ÜniversitesiElektrik Mühendisliği Ana Bilim Dalı
PROF. DR. AVNİ MORGÜL
- Çevresel geri saçılım haberleşme tabanlı bilişsel radyo ağlarının performans analizi
Performance analysis of ambient backscatter communication based cognitive radio networks
MUHAMMED YUSUF ONAY
Doktora
Türkçe
2023
Elektrik ve Elektronik MühendisliğiGazi ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. ÖZGÜR ERTUĞ