Geri Dön

Saklı markov modelleri ile konuşmacıdan bağımsız ayrık sözcük tanıma

Başlık çevirisi mevcut değil.

  1. Tez No: 47190
  2. Yazar: GÜLGÜN GÜVENÇ
  3. Danışmanlar: Y.DOÇ.DR. A. SEMİH BİNGÖL
  4. Tez Türü: Yüksek Lisans
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Konuşma tanıma, Saklı Markov Modeli, Speech recognition, Hidden Markov Model
  7. Yıl: 1995
  8. Dil: Türkçe
  9. Üniversite: Hacettepe Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Belirtilmemiş.
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 88

Özet

IV ÖZET Son yıllarda konuşma tanıma uygulamalarında çok popüler olan Saklı Markov Modelleri ile oldukça büyük tanıma başaranları elde edildiği bilinmektedir. Bu tez çalışmasında parametrik istatistiksel bir yöntem olan Saklı Markov Modeli yaklaşımma dayalı konuşmacıdan bağımsız bir Türkçe ayrık sözcük tanıma sistemi gerçeMeştirilmiştir. Sistem dağarcığı geniş bir kullanım alanına sahip 136 Türkçe sözcükten oluşmaktadır. Bu 136 sözcük için çeşitli yaş gruplarında 13 kadın ve 27 erkek konuşmacıdan ses örnekleri alınarak bir veri tabam oluşturulmuş ve algoritmalar bu veri tabam üzerinde denenmiştir. Her bir sözcüğe ait konuşma sinyalleri doğrusal öngörümlü analiz, kepstral analiz ve delta kepstral analiz yapılarak işlenmiştir. Yapılan çalışmalarda kepstral katsayılar, delta-kepstral katsayılar ve normalize edilmiş log-enerji değerlerinin çeşitli şekillerde bMeşiminden oluşan özellik vektörleri denenmiştir. Ayrık gözlem olasılık yoğunluklanna sahip Saklı Markov Modeli kullanıldığı için gözlem dizileri özellik vektörlerinden vektör nicemleme yoluyla elde edilmiştir. Bu gözlem dizileri, Baum-Welch yönteminden yararlanılarak, soldan sağa modellerin eğitilmesinde kullanılmış ve sözcük modelleri oluşturulmuştur. Çalışma sırasında vektör nicemleyicinin kod-kitapçığı boyutu, modelin durum sayısı, vektör elemanlarının ağırlıkları, doğrusal öngörümlü analiz derecesi gibi sistemdeki değişebilir parametrelerin tanıma oranına etkisi araştırılarak en uygun değerler bulunmuştur. Elde ettiğimiz tanıma başaranları 136 sözcük için %90, sözcük dağarcığı içinde özel bir öneme sahip olan 0-9 arası rakamlar için ise %97 civarındadır. Son olarak, sistemin başaranım etkileyen faktörlerden bahsedilerek, tanıma oranının arttırılabilmesi için yapılması gerekenler tartışılmış ve daha sonraki araştırmalar için öneriler yapılmıştır.

Özet (Çeviri)

ABSTRACT It is known that in speech recognition applications using the popular Hidden Markov Models (HMM) high recognition rates have been achieved during the past decade. In this thesis, a speaker-independent, isolated-word recognition system has been realized using the HMM approach. The vocabulary of the system consists of 136 Turkish words, having a wide range of applications. Utterances from 13 female and 27 male speakers in various ages groups have been recorded, and the algorithms have been tested using this database. The speech signals have been processed using linear prediction and cepstral analysis. Feature vectors consisting of various combinations of cepstral coefficients, delta-cepstral coefficients and normalized log-energy values have been tried. The observation sequences have been obtained by vector quantizing the feature vectors. These observation sequences have then been used to train the left to right models using the Baum-Welch algorithm. System parameters such as the codebook size, the number of states of the HMM and the weights of the feature vector elements have been varied to investigate their effects on recognition rate. For the 136 word vocabulary, a recognition rate of about 90% has been achieved. On the other hand, for the digit vocabulary which has a special place in word recognition a performance of about 97% have been obtained. Finally, factors affecting the system performance along with means to increase the recognition rate have been discussed and suggestions for future research have been proposed.

Benzer Tezler

  1. A speaker independent isolated word recognition system for Turkish

    Türkçe için konuşmacıdan bağımsız yalıtılmış sözcük tanıyım dizgesi

    ÖMER BURAK TÜZÜN

    Yüksek Lisans

    İngilizce

    İngilizce

    1995

    Elektrik ve Elektronik MühendisliğiOrta Doğu Teknik Üniversitesi

    PROF.DR. MÜBECCEL DEMİREKLER

  2. Multimodal analysis and synthesis of affective human body gestures from speech prosody

    Konuşma bürününden duygu yüklü insan beden jestleri çok kipli analizi ve sentezi

    ELİF BOZKURT

    Doktora

    İngilizce

    İngilizce

    2016

    Elektrik ve Elektronik MühendisliğiKoç Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ENGİN ERZİN

  3. Isolated and connected digit recognition system for Turkish

    Türkçe için konuşmacıdan bağımsız yalıtılmış sözcük ve bileşik rakam tanıyım dizgesi

    ALİ HAYDAR

    Yüksek Lisans

    İngilizce

    İngilizce

    1994

    Elektrik ve Elektronik MühendisliğiOrta Doğu Teknik Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. MÜBECCEL DEMİREKLER

  4. Cross-lingual voice conversion

    Diller arasında konuşmacı dönüştürme

    OYTUN TÜRK

    Doktora

    İngilizce

    İngilizce

    2007

    Elektrik ve Elektronik MühendisliğiBoğaziçi Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    PROF.DR. LEVENT MUSTAFA ARSLAN

  5. Identity verification using voice and its use in a privacy preserving system

    Kimlik tanımada mahremiyet korumalı bir senaryo için sesin kullanımı

    EREN ÇAMLIKAYA

    Yüksek Lisans

    İngilizce

    İngilizce

    2008

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSabancı Üniversitesi

    Bilgisayar Mühendisliği Bölümü

    DOÇ. DR. BERRİN YANIKOĞLU

    YRD. DOÇ. DR. HAKAN ERDOĞAN