Sözcük-altı modeller kullanarak ayrık sözcük tanıma

Isolated word recognition using subword models

Tez No: 66094
Yazar: AYDIN BAYRİ
Danışmanlar: YRD. DOÇ. DR. A. SEMİH BİNGÖL
Tez Türü: Yüksek Lisans
Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
Anahtar Kelimeler: Sözcük-altı birimler, Saklı Markov Modelleri, Konuşma tanıma, Subword units, Hidden Markov Models, Speech recognition
Yıl: 1997
Dil: Türkçe
Üniversite: Hacettepe Üniversitesi
Enstitü: Fen Bilimleri Enstitüsü
Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
Bilim Dalı: Belirtilmemiş.
Sayfa Sayısı: 63

Özet

IV ÖZET Az sayıda sözcük içeren konuşma tanıma uygulamalarında temel ses birimi olarak bütün-sözcük modelleri başarıyla kullanılmaktadır. Ancak, çok sayıda sözcüğün tanınması gerektiğinde, bütün-sözcük modeli kullanmak pratik olmaktan çıkmakta ve hatta imkansız hale gelmektedir. Bu durumda tanınacak temel birim olarak sözcük-altı birimleri kullanmak zorunluluğu doğar. Bu çalışmada, sözcük-altı birimler kullanılarak bir Türkçe ayrık sözcük tanıma sistemi gerçekleştirilmiştir. Yapılan çalışmada, 136 Türkçe sözcükten oluşan ve 40 konuşmacıdan alman ses örnekleri içeren bir veri tabam kullanılmıştır, özellik vektörleri 14 ağırlıklı kepstral katsayı, 14 ağırlıklı delta-kepstral katsayı ve normalize edilmiş log- enerji ile oluşturulmuştur. Sözcük-altı birim olarak fonem ve bağlama-özgü fonem kullanılmıştır. Sözcük-altı birimler 3-durumlu soldan-sağa sürekli gözlem olasılık yoğunluğuna sahip Saklı Markov Modelleri ile modellenmiştir. Eğitim, bölütsel k-ortalama algoritması ile gerçekleştirilmiştir. Elde edilen en iyi tanıma oranlan; eğitim sırasında kullanılmayan sözcükler için %86, eğitim sırasında kullanılan sözcükler için %97.35 ve“0-9”arasındaki rakamlar için ise %99 olmuştur.

Özet (Çeviri)

ABSTRACT In speech recognition applications with small vocabularies, whole-word models have successfully been used as the fundamental speech units. However, when the number of words to be recognized becomes large, using whole-word models becomes impractical or even impossible. In this case, one has to use subword units as the fundamental unit to be recognized. In this study, a subword-based isolated word recognition system for Turkish words has been realized. A speech database of 136 Turkish words recorded from 40 speakers has been used in this study. The feature vectors are composed of 14 weighted cepstral coefficients, 14 weighted delta-cepstral coefficients and a normalized log- energy value. Phonemes and context-dependent phonemes have been used as the subword units. The subword units are modelled using 3-state left-to-right continuous observation density Hidden Markov Models. Training is accomplished using the segmental k-means algorithm. The highest recognition rates obtained are, 86% for words not used in the training phase, 97.35% for words which were also used in the training phase and 99% for the digits.

Benzer Tezler

Tez No
38568
A speaker independent isolated word recognition system for Turkish
Türkçe için konuşmacıdan bağımsız yalıtılmış sözcük tanıyım dizgesi
ÖMER BURAK TÜZÜN
Yüksek Lisans
İngilizce
1995
Elektrik ve Elektronik Mühendisliği Orta Doğu Teknik Üniversitesi
PROF.DR. MÜBECCEL DEMİREKLER
Tez No
618417
Evaluating the performance of different continous vector representation methods for turkish words
Türkçe sözcükler için farklı sürekli vektör temsilyöntemlerinin başarım değerlendirmesi
GÖKHAN GÜLER
Yüksek Lisans
İngilizce
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol İstanbul Teknik Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. AHMET CÜNEYD TANTUĞ
Tez No
895368
Derin öğrenme yöntemleri ile Türkçede bağlılık ayrıştırma
Dependency parsing with deep learning methods in Turkish
MÜCAHİT ALTINTAŞ
Doktora
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol İstanbul Teknik Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. AHMET CÜNEYD TANTUĞ
Tez No
503788
Investigating the performance of segmentation methods with deep learning models for sentiment analysis on Turkish informal texts
Segmentasyon yöntemlerinin informal Türkçe metinlerde duygusal analiz için derin öğrenme modelleri ile kullanımında performans analizi
FATİH KURT
Yüksek Lisans
İngilizce
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Orta Doğu Teknik Üniversitesi
Bilişim Sistemleri Ana Bilim Dalı
PROF. DR. PINAR KARAGÖZ
Tez No
343082
Power of frequencies: N-grams and semi-supervised morphological segmentation in Turkish
Tekrarların gücü: Türkçe'de N-gramlar ve yarı-denetimli biçimbilimsel bölme
ÖZKAN KILIÇ
Doktora
İngilizce
2013
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Orta Doğu Teknik Üniversitesi
Bilişsel Bilim Ana Bilim Dalı
PROF. DR. HÜSEYİN CEM BOZŞAHİN

Geri Dön