Geri Dön

Sözcük-altı modeller kullanarak ayrık sözcük tanıma

Isolated word recognition using subword models

  1. Tez No: 66094
  2. Yazar: AYDIN BAYRİ
  3. Danışmanlar: YRD. DOÇ. DR. A. SEMİH BİNGÖL
  4. Tez Türü: Yüksek Lisans
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Sözcük-altı birimler, Saklı Markov Modelleri, Konuşma tanıma, Subword units, Hidden Markov Models, Speech recognition
  7. Yıl: 1997
  8. Dil: Türkçe
  9. Üniversite: Hacettepe Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 63

Özet

IV ÖZET Az sayıda sözcük içeren konuşma tanıma uygulamalarında temel ses birimi olarak bütün-sözcük modelleri başarıyla kullanılmaktadır. Ancak, çok sayıda sözcüğün tanınması gerektiğinde, bütün-sözcük modeli kullanmak pratik olmaktan çıkmakta ve hatta imkansız hale gelmektedir. Bu durumda tanınacak temel birim olarak sözcük-altı birimleri kullanmak zorunluluğu doğar. Bu çalışmada, sözcük-altı birimler kullanılarak bir Türkçe ayrık sözcük tanıma sistemi gerçekleştirilmiştir. Yapılan çalışmada, 136 Türkçe sözcükten oluşan ve 40 konuşmacıdan alman ses örnekleri içeren bir veri tabam kullanılmıştır, özellik vektörleri 14 ağırlıklı kepstral katsayı, 14 ağırlıklı delta-kepstral katsayı ve normalize edilmiş log- enerji ile oluşturulmuştur. Sözcük-altı birim olarak fonem ve bağlama-özgü fonem kullanılmıştır. Sözcük-altı birimler 3-durumlu soldan-sağa sürekli gözlem olasılık yoğunluğuna sahip Saklı Markov Modelleri ile modellenmiştir. Eğitim, bölütsel k-ortalama algoritması ile gerçekleştirilmiştir. Elde edilen en iyi tanıma oranlan; eğitim sırasında kullanılmayan sözcükler için %86, eğitim sırasında kullanılan sözcükler için %97.35 ve“0-9”arasındaki rakamlar için ise %99 olmuştur.

Özet (Çeviri)

ABSTRACT In speech recognition applications with small vocabularies, whole-word models have successfully been used as the fundamental speech units. However, when the number of words to be recognized becomes large, using whole-word models becomes impractical or even impossible. In this case, one has to use subword units as the fundamental unit to be recognized. In this study, a subword-based isolated word recognition system for Turkish words has been realized. A speech database of 136 Turkish words recorded from 40 speakers has been used in this study. The feature vectors are composed of 14 weighted cepstral coefficients, 14 weighted delta-cepstral coefficients and a normalized log- energy value. Phonemes and context-dependent phonemes have been used as the subword units. The subword units are modelled using 3-state left-to-right continuous observation density Hidden Markov Models. Training is accomplished using the segmental k-means algorithm. The highest recognition rates obtained are, 86% for words not used in the training phase, 97.35% for words which were also used in the training phase and 99% for the digits.

Benzer Tezler

  1. A speaker independent isolated word recognition system for Turkish

    Türkçe için konuşmacıdan bağımsız yalıtılmış sözcük tanıyım dizgesi

    ÖMER BURAK TÜZÜN

    Yüksek Lisans

    İngilizce

    İngilizce

    1995

    Elektrik ve Elektronik MühendisliğiOrta Doğu Teknik Üniversitesi

    PROF.DR. MÜBECCEL DEMİREKLER

  2. Evaluating the performance of different continous vector representation methods for turkish words

    Türkçe sözcükler için farklı sürekli vektör temsilyöntemlerinin başarım değerlendirmesi

    GÖKHAN GÜLER

    Yüksek Lisans

    İngilizce

    İngilizce

    2020

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. AHMET CÜNEYD TANTUĞ

  3. Derin öğrenme yöntemleri ile Türkçede bağlılık ayrıştırma

    Dependency parsing with deep learning methods in Turkish

    MÜCAHİT ALTINTAŞ

    Doktora

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. AHMET CÜNEYD TANTUĞ

  4. Investigating the performance of segmentation methods with deep learning models for sentiment analysis on Turkish informal texts

    Segmentasyon yöntemlerinin informal Türkçe metinlerde duygusal analiz için derin öğrenme modelleri ile kullanımında performans analizi

    FATİH KURT

    Yüksek Lisans

    İngilizce

    İngilizce

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Bilişim Sistemleri Ana Bilim Dalı

    PROF. DR. PINAR KARAGÖZ

  5. Power of frequencies: N-grams and semi-supervised morphological segmentation in Turkish

    Tekrarların gücü: Türkçe'de N-gramlar ve yarı-denetimli biçimbilimsel bölme

    ÖZKAN KILIÇ

    Doktora

    İngilizce

    İngilizce

    2013

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Bilişsel Bilim Ana Bilim Dalı

    PROF. DR. HÜSEYİN CEM BOZŞAHİN