Saklı markov modelleri ile konuşmacıdan bağımsız ayrık sözcük tanıma
Başlık çevirisi mevcut değil.
- Tez No: 47190
- Danışmanlar: Y.DOÇ.DR. A. SEMİH BİNGÖL
- Tez Türü: Yüksek Lisans
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Konuşma tanıma, Saklı Markov Modeli, Speech recognition, Hidden Markov Model
- Yıl: 1995
- Dil: Türkçe
- Üniversite: Hacettepe Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Belirtilmemiş.
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 88
Özet
IV ÖZET Son yıllarda konuşma tanıma uygulamalarında çok popüler olan Saklı Markov Modelleri ile oldukça büyük tanıma başaranları elde edildiği bilinmektedir. Bu tez çalışmasında parametrik istatistiksel bir yöntem olan Saklı Markov Modeli yaklaşımma dayalı konuşmacıdan bağımsız bir Türkçe ayrık sözcük tanıma sistemi gerçeMeştirilmiştir. Sistem dağarcığı geniş bir kullanım alanına sahip 136 Türkçe sözcükten oluşmaktadır. Bu 136 sözcük için çeşitli yaş gruplarında 13 kadın ve 27 erkek konuşmacıdan ses örnekleri alınarak bir veri tabam oluşturulmuş ve algoritmalar bu veri tabam üzerinde denenmiştir. Her bir sözcüğe ait konuşma sinyalleri doğrusal öngörümlü analiz, kepstral analiz ve delta kepstral analiz yapılarak işlenmiştir. Yapılan çalışmalarda kepstral katsayılar, delta-kepstral katsayılar ve normalize edilmiş log-enerji değerlerinin çeşitli şekillerde bMeşiminden oluşan özellik vektörleri denenmiştir. Ayrık gözlem olasılık yoğunluklanna sahip Saklı Markov Modeli kullanıldığı için gözlem dizileri özellik vektörlerinden vektör nicemleme yoluyla elde edilmiştir. Bu gözlem dizileri, Baum-Welch yönteminden yararlanılarak, soldan sağa modellerin eğitilmesinde kullanılmış ve sözcük modelleri oluşturulmuştur. Çalışma sırasında vektör nicemleyicinin kod-kitapçığı boyutu, modelin durum sayısı, vektör elemanlarının ağırlıkları, doğrusal öngörümlü analiz derecesi gibi sistemdeki değişebilir parametrelerin tanıma oranına etkisi araştırılarak en uygun değerler bulunmuştur. Elde ettiğimiz tanıma başaranları 136 sözcük için %90, sözcük dağarcığı içinde özel bir öneme sahip olan 0-9 arası rakamlar için ise %97 civarındadır. Son olarak, sistemin başaranım etkileyen faktörlerden bahsedilerek, tanıma oranının arttırılabilmesi için yapılması gerekenler tartışılmış ve daha sonraki araştırmalar için öneriler yapılmıştır.
Özet (Çeviri)
ABSTRACT It is known that in speech recognition applications using the popular Hidden Markov Models (HMM) high recognition rates have been achieved during the past decade. In this thesis, a speaker-independent, isolated-word recognition system has been realized using the HMM approach. The vocabulary of the system consists of 136 Turkish words, having a wide range of applications. Utterances from 13 female and 27 male speakers in various ages groups have been recorded, and the algorithms have been tested using this database. The speech signals have been processed using linear prediction and cepstral analysis. Feature vectors consisting of various combinations of cepstral coefficients, delta-cepstral coefficients and normalized log-energy values have been tried. The observation sequences have been obtained by vector quantizing the feature vectors. These observation sequences have then been used to train the left to right models using the Baum-Welch algorithm. System parameters such as the codebook size, the number of states of the HMM and the weights of the feature vector elements have been varied to investigate their effects on recognition rate. For the 136 word vocabulary, a recognition rate of about 90% has been achieved. On the other hand, for the digit vocabulary which has a special place in word recognition a performance of about 97% have been obtained. Finally, factors affecting the system performance along with means to increase the recognition rate have been discussed and suggestions for future research have been proposed.
Benzer Tezler
- A speaker independent isolated word recognition system for Turkish
Türkçe için konuşmacıdan bağımsız yalıtılmış sözcük tanıyım dizgesi
ÖMER BURAK TÜZÜN
Yüksek Lisans
İngilizce
1995
Elektrik ve Elektronik MühendisliğiOrta Doğu Teknik ÜniversitesiPROF.DR. MÜBECCEL DEMİREKLER
- Multimodal analysis and synthesis of affective human body gestures from speech prosody
Konuşma bürününden duygu yüklü insan beden jestleri çok kipli analizi ve sentezi
ELİF BOZKURT
Doktora
İngilizce
2016
Elektrik ve Elektronik MühendisliğiKoç ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. ENGİN ERZİN
- Isolated and connected digit recognition system for Turkish
Türkçe için konuşmacıdan bağımsız yalıtılmış sözcük ve bileşik rakam tanıyım dizgesi
ALİ HAYDAR
Yüksek Lisans
İngilizce
1994
Elektrik ve Elektronik MühendisliğiOrta Doğu Teknik ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. MÜBECCEL DEMİREKLER
- Cross-lingual voice conversion
Diller arasında konuşmacı dönüştürme
OYTUN TÜRK
Doktora
İngilizce
2007
Elektrik ve Elektronik MühendisliğiBoğaziçi ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
PROF.DR. LEVENT MUSTAFA ARSLAN
- Identity verification using voice and its use in a privacy preserving system
Kimlik tanımada mahremiyet korumalı bir senaryo için sesin kullanımı
EREN ÇAMLIKAYA
Yüksek Lisans
İngilizce
2008
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSabancı ÜniversitesiBilgisayar Mühendisliği Bölümü
DOÇ. DR. BERRİN YANIKOĞLU
YRD. DOÇ. DR. HAKAN ERDOĞAN