Automatic speech segmentation based on subband decomposition
Alt bant ayrışıma dayalı otomatik konuşma bölütleme
- Tez No: 83713
- Danışmanlar: PROF. DR. A. ENİS ÇETİN
- Tez Türü: Yüksek Lisans
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Konuşma bölütleme, ses sınırlarını sezme, çoklu hızlı işleme, alt band ayrışım, izgel bozunum ölçüsü, bir-ötelemeli özilinti, sıradüzensel tepe sezici, araba gürültüsü, sese dayalı konuşma tanıma, Speech segmentation, phone boundary detection, multirate processing, subband decomposition, spectral distortion measures, lag-one autocorrelation, car noise, phone-based recognition. IV
- Yıl: 1999
- Dil: İngilizce
- Üniversite: İhsan Doğramacı Bilkent Üniversitesi
- Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 70
Özet
ÖZET ALT BANT AYRIŞIMA DAYALI OTOMATİK KONUŞMA BÖLÜTLEME Arçın Bozkurt Elektrik ve Elektronik Mühendisliği Yüksek Lisans Tez Yöneticisi: Prof. Dr. Enis Çetin Ocak 1999 Konuşma bölütleme konuşma işaretindeki seslerin sınırlarının belirlenmesi problemine karşılık gelir. Önerilen algoritma konuşma işaretini özel tasarlanan bir süzgeç öbeğinden geçirir ve her süzgeç çıktısının bir ötelemeli özilintisini hesaplar. Süzgeçler, gürültülü frekans kuşaklarındaki bilgiyi bastırabilmemizi sağlayan altbant ayrışım kullanılarak tasarlandı. Tasarlanan bant-geçiren süzgeçlerden her biri, çözümlemeye yeni bir frekans kuşağı ekleyerek, sonuçta tüm frekans bandını kaplarlar. Özilinti yapısındaki değişimleri nicelemek için bir bozunum ölçeği kullanıldı, t zaman anındaki bozunum, t anının çevresinde, yarısı örtüşecek şekilde alman iki çerçeveden elde edilen özilinti değerleri kullanılarak hesaplanır. Bu iki çerçeveden elde edilen özilinti değerlerinin farklılığını nicelemek için Kullback-Leiber tipi bir bozunum ölçüsü kullanıldı. Bozunum değerleri gezingesindeki tepeler bize ses sınırlarının yerlerini verir. Önerilen algoritma araba gürültüsü ile denendi. Bölütleme algoritmasıyla belirlenen sesler, sese dayalı konuşma tanıma sis teminde kullanıldı. Sesliler için makul tanıma oranları elde edildi.
Özet (Çeviri)
ABSTRACT AUTOMATIC SPEECH SEGMENTATION BASED ON SUBBAND DECOMPOSITION Arçın Bozkurt M.S. in Electrical and Electronics Engineering Supervisor: Prof. Dr. Enis Çetin January 1999 Speech segmentation refers to the problem of determining the boundaries of the phones in the speech signal. The proposed algorithm passes the speech signal through a specially designed filter bank and calculates the lag-one autocorrelation of the output of each filter. The filters are designed using subband decomposition which enables us to suppress information from the noise contaminated frequency bands. The filters are bandpass filters and every filter adds a new frequency band to the analysis. In the end the entire frequency band is covered. A distortion measure is used to quantify the deviations in the correlation structure. The distortion measure for the time instant t is calculated using the autocorrelation values of two frames of speech signal which are on either side of time t, such that, half of the frames overlap. A symmetrized Kullback- Leiber type measure is used to quantify the dissimilarity of the autocorrelation values obtained from these frames. The peaks in the trajectory of distortion measure values, give us the locations of the phone boundaries. The proposed algorithm is tested under car noise. The phones determined with the segmentation algorithm above are also used in a phone-based recognition system. Reasonable recognition rates are obtained for voiced sounds.
Benzer Tezler
- Automatic speech segmentation and database annotation
Otomatik konuşma bölütlendirme ve veri tabanı etiketlendirme
İ. YÜCEL ÖZBEK
Yüksek Lisans
İngilizce
2002
Elektrik ve Elektronik MühendisliğiOrta Doğu Teknik ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. MÜBECCEL DEMİREKLER
- Video segmentation based on audio feature extraction
Ses öznitelik çıkarımına dayalı video bölütlenmesi
NERİMAN ATAR
Yüksek Lisans
İngilizce
2009
Elektrik ve Elektronik MühendisliğiOrta Doğu Teknik ÜniversitesiElektrik ve Elektronik Mühendisliği Bölümü
PROF. DR. GÖZDE BOZDAĞI AKAR
- Automatic speech recognition in consecutive interpreter workstation: Computer-aided interpreting tool 'Sight-Terp'
Otomatik konuşma tanıma sistemlerinin ardıl çeviride kullanılması: Sight-Terp
CİHAN ÜNLÜ
Yüksek Lisans
İngilizce
2023
Mütercim-TercümanlıkHacettepe ÜniversitesiMütercim Tercümanlık Ana Bilim Dalı
PROF. DR. AYMİL DOĞAN
- Automatic segmentation and labeling of isolated Turkish words
Yalıtılmış türkçe kelimelerin otomatik olarak bölünüp etiketlenmesi
MUSTAFA BAYINDIR
Yüksek Lisans
İngilizce
1997
Elektrik ve Elektronik MühendisliğiOrta Doğu Teknik ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. MÜBECCEL DEMİREKLER
- İçerik tabanlı sorgu ve tarama için yapısal ve anlamsal ses içerik analizi
Structural and semantic analysis of audio content for content-based querying and browsing
MUSTAFA SERT
Doktora
Türkçe
2006
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiElektronik-Bilgisayar Eğitimi Ana Bilim Dalı
PROF.DR. BUYURMAN BAYKAL