Gürültülü ortamlarda Türkçe ayrık sözcük konuşma tanıma sistemi gerçekleştirimi
Realization of a Turkish isolated word speech recognition system under noisy environments
- Tez No: 84138
- Danışmanlar: PROF. DR. H. SELÇUK GEÇİM
- Tez Türü: Doktora
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 1999
- Dil: Türkçe
- Üniversite: Hacettepe Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 161
Özet
IV ÖZET Pratikte kullanılan konuşma tanıma sistemleri genellikle gürültüsüz veya yüksek sinyal gürültü oranlarına sahip ortamlarda eğitilmektedirler. Böyle bir sistemin başarımı, gürültülü bir ortamda veya farklı kanal özelliklerine sahip bir iletişim sisteminden geçtiğinde, eğitme ve test ortamlarının farklılığından dolayı ciddi oranlarda düşmektedir. Ortam farklılığından oluşan etkileri azaltmak amacıyla güvenilir bir konuşma tanıma sistemine ihtiyaç duyulur. Bu tez çalışması, gürültülü ortamlarda kullanılabilecek konuşma tanıma yöntemlerinin Türkçe veritabanları üzerindeki etkilerini araştırmak üzere, değişik yöntemler üzerinde yapılan çalışmalardan oluşmaktadır. Çalışma kapsamında yaşlan yirmi ile elli arasında değişen 23 erkek, 17 kadın konuşmacıdan yararlanılarak toplam 136 Türkçe ayrık sözcükten oluşan bir ayrık sözcükler veritabanı oluşturulmuştur. Bu veritabanının kullanımıyla küçük ölçekli ve orta ölçekli veritabanlarında çalışmalar yapılmıştır. Çalışmalar sırasında, değişik yöntemler arasında bir karşılaştırma yapılabilmesi için, konuşmacıdan bağımsız, sürekli olasılık yoğunluk işlevi kullanan Saklı Markov modeline (SMM) dayalı aynı konuşma tanıma sistemi yapısı kullanılmıştır. Gürültülü ortamda konuşma tanıma yöntemlerinden, gürültüye dirençli öznitelik vektörleri yaklaşımına giren Algısal Doğrusal öngörüm (ADÖ) ve RASTA (Relative Spectra) yöntemleri; uzaklık ölçütleri yaklaşımına giren öklit, Ağırlıklı İzdüşüm ölçütü (AİÖ) ve Değişinti Uyarlamalı Olabilirlik Ölçütü (Variance Adapted Likelihood Measure) yöntemleri; gürültü iyileştirme yaklaşımından ise Çoklu Çözünürlüklü Sinüs Dönüşümü (ÇÇSD) ve Wiener süzme (ÇÇSD+Wiener), İzgel Çıkartım (Spectral Subtraction) yöntemleri kullanılmıştır. Değişik tipteki gürültülerin etkilerini belirlemek amacıyla Gauss dağılımlı beyaz gürültü, dar ve geniş bantlı renkli gürültülerden yararlanılmıştır. Gauss dağılımlı beyaz gürültü altında orta ölçekli Türkçe veritabanı için 15 dB sinyal gürültü oranında değişinti uyarlamalı olabilirlik ölçütü %76.2, RASTA vektörlerine uygulanan ağırlıklı izdüşüm ölçütü ise %73.5 tanıma başarımı göstermişlerdir. Bu çalışma Türkçe dilinde uygulanan ilk gürültülü ortam konuşma tanıma çalışmasıdır.
Özet (Çeviri)
ABSTRACT Practical speech recognition systems are usually trained under noise-free or high SNR conditions. The performance of such a system significantly degrades under a noisy environment or passing through a communication channel with different channel characteristics due to adverse conditions. To overcome the environmental effects, a robust speech recognition system is required. This thesis covers the work done with different noisy speech recognition methods to investigate the effects on Turkish databases. An isolated word Turkish speech database is prepared by using the utterances recorded from a population of 23 male and 17 female speakers between the ages of 20 and 50. By use of this Turkish database, recognition trials are performed for small and medium sized databases. The same Hidden Markov model, based on a continuous probability density function is used throughout the experiments to be able to compare the results obtained using different methods. The methods, Perceptual Linear Prediction (PLP) and RASTA (Relative Spectra) which fall in the approach of noise resistance features; Euclidean measure, the Weighted Projection measure (WPM) and the Variance Adapted Likelihood measure (VALM) from the class of distance measures and Multi Resolution Sinusoidal Transform plus Wiener filtering (MRST+Wiener) and the Spectral subtraction which are from the class of speech enhancement are investigated. To determine the effects of different kinds of noise, Gaussian distributed white noise and narrow and broadband colored noise are used. The word recognition rates for the variance adapted likelihood measure and RASTA derived weighted projection measure are recorded as 76.2 % and 73.5 % respectively, under Gaussian distributed white noise at 15 dB SNR for medium size Turkish database. This thesis is the first speech recognition study for noisy environments applied in Turkish language.
Benzer Tezler
- Marmara Bölgesi'nde soğurulma yapısının incelenmesi
Investigation of attenuation structure in the Marmara region
AYŞE KAŞLILAR ÖZCAN
- Global farklı yer belirleme sistemleri için atik süzgeç uygulamaları
Agile filter applications for different global positioning systems
MESUT ATASOYU
Yüksek Lisans
Türkçe
2014
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. HULUSİ HAKAN KUNTMAN
- Yaşa bağlı işitme kaybının önlenmesi ve tedavisinde koenzim q10'un etkisi
The effects of coenzyme q10 in the prevention and treatment of age-related hearing loss
TOGAY MÜDERRİS
Doktora
Türkçe
2020
Kulak Burun ve BoğazAnkara Yıldırım Beyazıt ÜniversitesiKulak Burun Boğaz Ana Bilim Dalı
PROF. DR. MEHMET ALİ BABADEMEZ
- Normal işitmeye sahip adölesanlarda immitansmetrik ölçüm ve akustik refleks testlerinin değerlendirilmesi.
Evaluation of immitancemetric measurements and acoustic reflex testing in adolescents whit normal hearing
ŞUAYP KÜÇÜK
Yüksek Lisans
Türkçe
2016
Sağlık EğitimiTurgut Özal ÜniversitesiOdyoloji ve Konuşma Bozuklukları Ana Bilim Dalı
YRD. DOÇ. DR. MUSTAFA YÜKSEL
- Koklear implantlı çocuklarda FM sistem kullanımının dil gelişimine etkisi
Effect of FM systems on language development of listeners with cochlear implant
TUĞBA ŞENER
Yüksek Lisans
Türkçe
2012
Kulak Burun ve BoğazDokuz Eylül ÜniversitesiKulak Burun Boğaz Ana Bilim Dalı
PROF. DR. BÜLENT ŞERBETÇİOĞLU