Geri Dön

Speech spectrum non-stationarity detection based on line spectrum frequencier and related applications

Çizgi izge sıklıklarının temel alınması ile konuşma izgesindeki durağansızlığın sezimi ve ilgili uygulamalar

  1. Tez No: 79328
  2. Yazar: ALİ ERDEM ERTAN
  3. Danışmanlar: PROF. DR. A. ENİS ÇETİN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Konuşma değişgenlik ölçüsü, izgideki durağansızlıkların sezimi, formant kestirimi, Çizgi Izge Sıklıkları (ÇIS), konuşma bölütleme, Karışık Tahrikli Doğrusal Öngörülü (KTDÖ) kodlama, değişken ikil-hızlı ses kodlayıcısı, ses faaliyet sezimi. iv, Speech variation measure, spectrum non-stationarity detection, formant estimation, Line Spectrum Frequencies (LSF), speech segmentation, Mixed Excitation Linear Predictive coding (MELP), variable bit-rate vocoder, voice activity detector. in
  7. Yıl: 1998
  8. Dil: İngilizce
  9. Üniversite: İhsan Doğramacı Bilkent Üniversitesi
  10. Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 149

Özet

ÖZET ÇİZGİ İZGE SIKLIKLARININ TEMEL ALINMASI İLE KONUŞMA İZGESİNDEKİ DURAĞANSIZLIĞIN SEZİMİ VE İLGİLİ UYGULAMALAR Ali Erdem ERTAN Elektrik ve Elektronik Mühendisliği Bölümü Yüksek Lisans Tez Yöneticisi: Prof. Dr. A. Enis Çetin Ekim 1998 Bu tezde, konuşma izgesindeki durağansızlıkların sezimi için iki yeni konuşma değişgenlik ölçüsü önerilmiştir. Bu ölçüler yaratılırken Çizgi Izge Sıklıkları (ÇİS) ve ÇIS konumlarındaki izgesel değerler taban alınmıştır. Önerilen ölçüler öznel olarak anlamlı ve düşük hesaplama karmaşıklığı olacak ve matem atiksel olarak izlenebilecek şekilde formüle edilmişlerdir. Durağansızlık sez- imleyicisinin yararlılığım göstermek için iki uygulama sunulmuştur: Birinci uygulama, konuşma sinyalindeki durağansız bölgeleri bulan ve bu bölgelerde bulunan konuşma parçalarının sınırlarını sezimleyen bir kesin konuşma bölütleyicisidir. Öteki uygulama ise konuşmadaki sessiz bölgeleri sezimleyen yeni bir konuşma faaliyet sezimcisini kullanan Değişken İkil Hızlı-Karışık Tahrikli Doğrusal Öngörülü (DIH-KTDÖ) kodlama ses kodlayıcısıdır. Bu ses faaliyet kestirimcisi, durağansız arka plan gürültüsüne dayanıklı olacak şekilde tasarlanmıştır ve ikil-hızın düşürülmesi için sessiz bölgelerin ve sessiz harflerin verimli kodlanmasına olanak sağlamaktadır. Test sonuçları da tezde sunulmuştur.

Özet (Çeviri)

ABSTRACT SPEECH SPECTRUM NON-STATIONARITY DETECTION BASED ON LINE SPECTRUM FREQUENCIES AND RELATED APPLICATIONS Ali Erdem ERTAN M.S. in Electrical and Electronics Engineering Supervisor: A. Enis Çetin, Ph. D October 1998 In this thesis, two new speech variation measures for speech spectrum non- stationarity detection are proposed. These measures are based on the Line Spectrum Frequencies (LSF) and the spectral values at the LSF locations. They are formulated to be subjectively meaningful, mathematically tractable, and also have low computational complexity property. In order to demonstrate the usefulness of the non-stationarity detector, two applications are presented: The first application is an implicit speech segmentation system which detects non-stationary regions in speech signal and obtains the boundaries of the speech segments. The other application is a Variable Bit-Rate Mixed Excitation Lin ear Predictive (VBR-MELP) vocoder utilizing a novel voice activity detector to detect silent regions in the speech. This voice activity detector is designed to be robust to non-stationary background noise and provides efficient coding of silent sections and unvoiced utterances to decrease the bit-rate. Simulation results are also presented.

Benzer Tezler

  1. Zamanla değişen kanalların kestirimi ve uyarlamalı kodlama

    The Estimation of time varying channels and adaptive coding

    CÜNEYT DELİKTAŞ

    Yüksek Lisans

    Türkçe

    Türkçe

    1997

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ÜMİT AYGÖLÜ

  2. Düşük bir hızlarında konuşma kodlama ve uygulamaları

    Low bit rate speech coding and applications

    TARIK AŞKIN

  3. Ego noise estimation for robot audition

    Başlık çevirisi yok

    GÖKHAN İNCE

    Doktora

    İngilizce

    İngilizce

    2011

    Makine MühendisliğiTokyo Institute of Technology

    PROF. JUNİCHİ IMURA

  4. Enhancement of the coded speech using filtering

    Filtreleme kullanarak kodlanmış sesin iyileştirilmesi

    SALİH SİNAN TAYLAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2017

    Elektrik ve Elektronik MühendisliğiIşık Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ÜMİT GÜZ

    DOÇ. DR. HAKAN GÜRKAN

  5. İki boyutlu kafes parametrelerinin sınırlı veri alanlarından hesaplanması

    The Calculation of the 2-D lattice parameters from short data records

    NURŞEN YILDIZ

    Yüksek Lisans

    Türkçe

    Türkçe

    1994

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    PROF.DR. AHMET HAMDİ KAYRAN