Geri Dön

Automatic speech segmentation based on subband decomposition

Alt bant ayrışıma dayalı otomatik konuşma bölütleme

  1. Tez No: 83713
  2. Yazar: ARÇIN BOZKURT
  3. Danışmanlar: PROF. DR. A. ENİS ÇETİN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Konuşma bölütleme, ses sınırlarını sezme, çoklu hızlı işleme, alt band ayrışım, izgel bozunum ölçüsü, bir-ötelemeli özilinti, sıradüzensel tepe sezici, araba gürültüsü, sese dayalı konuşma tanıma, Speech segmentation, phone boundary detection, multirate processing, subband decomposition, spectral distortion measures, lag-one autocorrelation, car noise, phone-based recognition. IV
  7. Yıl: 1999
  8. Dil: İngilizce
  9. Üniversite: İhsan Doğramacı Bilkent Üniversitesi
  10. Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 70

Özet

ÖZET ALT BANT AYRIŞIMA DAYALI OTOMATİK KONUŞMA BÖLÜTLEME Arçın Bozkurt Elektrik ve Elektronik Mühendisliği Yüksek Lisans Tez Yöneticisi: Prof. Dr. Enis Çetin Ocak 1999 Konuşma bölütleme konuşma işaretindeki seslerin sınırlarının belirlenmesi problemine karşılık gelir. Önerilen algoritma konuşma işaretini özel tasarlanan bir süzgeç öbeğinden geçirir ve her süzgeç çıktısının bir ötelemeli özilintisini hesaplar. Süzgeçler, gürültülü frekans kuşaklarındaki bilgiyi bastırabilmemizi sağlayan altbant ayrışım kullanılarak tasarlandı. Tasarlanan bant-geçiren süzgeçlerden her biri, çözümlemeye yeni bir frekans kuşağı ekleyerek, sonuçta tüm frekans bandını kaplarlar. Özilinti yapısındaki değişimleri nicelemek için bir bozunum ölçeği kullanıldı, t zaman anındaki bozunum, t anının çevresinde, yarısı örtüşecek şekilde alman iki çerçeveden elde edilen özilinti değerleri kullanılarak hesaplanır. Bu iki çerçeveden elde edilen özilinti değerlerinin farklılığını nicelemek için Kullback-Leiber tipi bir bozunum ölçüsü kullanıldı. Bozunum değerleri gezingesindeki tepeler bize ses sınırlarının yerlerini verir. Önerilen algoritma araba gürültüsü ile denendi. Bölütleme algoritmasıyla belirlenen sesler, sese dayalı konuşma tanıma sis teminde kullanıldı. Sesliler için makul tanıma oranları elde edildi.

Özet (Çeviri)

ABSTRACT AUTOMATIC SPEECH SEGMENTATION BASED ON SUBBAND DECOMPOSITION Arçın Bozkurt M.S. in Electrical and Electronics Engineering Supervisor: Prof. Dr. Enis Çetin January 1999 Speech segmentation refers to the problem of determining the boundaries of the phones in the speech signal. The proposed algorithm passes the speech signal through a specially designed filter bank and calculates the lag-one autocorrelation of the output of each filter. The filters are designed using subband decomposition which enables us to suppress information from the noise contaminated frequency bands. The filters are bandpass filters and every filter adds a new frequency band to the analysis. In the end the entire frequency band is covered. A distortion measure is used to quantify the deviations in the correlation structure. The distortion measure for the time instant t is calculated using the autocorrelation values of two frames of speech signal which are on either side of time t, such that, half of the frames overlap. A symmetrized Kullback- Leiber type measure is used to quantify the dissimilarity of the autocorrelation values obtained from these frames. The peaks in the trajectory of distortion measure values, give us the locations of the phone boundaries. The proposed algorithm is tested under car noise. The phones determined with the segmentation algorithm above are also used in a phone-based recognition system. Reasonable recognition rates are obtained for voiced sounds.

Benzer Tezler

  1. Automatic speech segmentation and database annotation

    Otomatik konuşma bölütlendirme ve veri tabanı etiketlendirme

    İ. YÜCEL ÖZBEK

    Yüksek Lisans

    İngilizce

    İngilizce

    2002

    Elektrik ve Elektronik MühendisliğiOrta Doğu Teknik Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. MÜBECCEL DEMİREKLER

  2. Video segmentation based on audio feature extraction

    Ses öznitelik çıkarımına dayalı video bölütlenmesi

    NERİMAN ATAR

    Yüksek Lisans

    İngilizce

    İngilizce

    2009

    Elektrik ve Elektronik MühendisliğiOrta Doğu Teknik Üniversitesi

    Elektrik ve Elektronik Mühendisliği Bölümü

    PROF. DR. GÖZDE BOZDAĞI AKAR

  3. Automatic speech recognition in consecutive interpreter workstation: Computer-aided interpreting tool 'Sight-Terp'

    Otomatik konuşma tanıma sistemlerinin ardıl çeviride kullanılması: Sight-Terp

    CİHAN ÜNLÜ

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Mütercim-TercümanlıkHacettepe Üniversitesi

    Mütercim Tercümanlık Ana Bilim Dalı

    PROF. DR. AYMİL DOĞAN

  4. Automatic segmentation and labeling of isolated Turkish words

    Yalıtılmış türkçe kelimelerin otomatik olarak bölünüp etiketlenmesi

    MUSTAFA BAYINDIR

    Yüksek Lisans

    İngilizce

    İngilizce

    1997

    Elektrik ve Elektronik MühendisliğiOrta Doğu Teknik Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. MÜBECCEL DEMİREKLER

  5. İçerik tabanlı sorgu ve tarama için yapısal ve anlamsal ses içerik analizi

    Structural and semantic analysis of audio content for content-based querying and browsing

    MUSTAFA SERT

    Doktora

    Türkçe

    Türkçe

    2006

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Elektronik-Bilgisayar Eğitimi Ana Bilim Dalı

    PROF.DR. BUYURMAN BAYKAL