Sözcük-altı modeller kullanarak ayrık sözcük tanıma
Isolated word recognition using subword models
- Tez No: 66094
- Danışmanlar: YRD. DOÇ. DR. A. SEMİH BİNGÖL
- Tez Türü: Yüksek Lisans
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Sözcük-altı birimler, Saklı Markov Modelleri, Konuşma tanıma, Subword units, Hidden Markov Models, Speech recognition
- Yıl: 1997
- Dil: Türkçe
- Üniversite: Hacettepe Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 63
Özet
IV ÖZET Az sayıda sözcük içeren konuşma tanıma uygulamalarında temel ses birimi olarak bütün-sözcük modelleri başarıyla kullanılmaktadır. Ancak, çok sayıda sözcüğün tanınması gerektiğinde, bütün-sözcük modeli kullanmak pratik olmaktan çıkmakta ve hatta imkansız hale gelmektedir. Bu durumda tanınacak temel birim olarak sözcük-altı birimleri kullanmak zorunluluğu doğar. Bu çalışmada, sözcük-altı birimler kullanılarak bir Türkçe ayrık sözcük tanıma sistemi gerçekleştirilmiştir. Yapılan çalışmada, 136 Türkçe sözcükten oluşan ve 40 konuşmacıdan alman ses örnekleri içeren bir veri tabam kullanılmıştır, özellik vektörleri 14 ağırlıklı kepstral katsayı, 14 ağırlıklı delta-kepstral katsayı ve normalize edilmiş log- enerji ile oluşturulmuştur. Sözcük-altı birim olarak fonem ve bağlama-özgü fonem kullanılmıştır. Sözcük-altı birimler 3-durumlu soldan-sağa sürekli gözlem olasılık yoğunluğuna sahip Saklı Markov Modelleri ile modellenmiştir. Eğitim, bölütsel k-ortalama algoritması ile gerçekleştirilmiştir. Elde edilen en iyi tanıma oranlan; eğitim sırasında kullanılmayan sözcükler için %86, eğitim sırasında kullanılan sözcükler için %97.35 ve“0-9”arasındaki rakamlar için ise %99 olmuştur.
Özet (Çeviri)
ABSTRACT In speech recognition applications with small vocabularies, whole-word models have successfully been used as the fundamental speech units. However, when the number of words to be recognized becomes large, using whole-word models becomes impractical or even impossible. In this case, one has to use subword units as the fundamental unit to be recognized. In this study, a subword-based isolated word recognition system for Turkish words has been realized. A speech database of 136 Turkish words recorded from 40 speakers has been used in this study. The feature vectors are composed of 14 weighted cepstral coefficients, 14 weighted delta-cepstral coefficients and a normalized log- energy value. Phonemes and context-dependent phonemes have been used as the subword units. The subword units are modelled using 3-state left-to-right continuous observation density Hidden Markov Models. Training is accomplished using the segmental k-means algorithm. The highest recognition rates obtained are, 86% for words not used in the training phase, 97.35% for words which were also used in the training phase and 99% for the digits.
Benzer Tezler
- A speaker independent isolated word recognition system for Turkish
Türkçe için konuşmacıdan bağımsız yalıtılmış sözcük tanıyım dizgesi
ÖMER BURAK TÜZÜN
Yüksek Lisans
İngilizce
1995
Elektrik ve Elektronik MühendisliğiOrta Doğu Teknik ÜniversitesiPROF.DR. MÜBECCEL DEMİREKLER
- Evaluating the performance of different continous vector representation methods for turkish words
Türkçe sözcükler için farklı sürekli vektör temsilyöntemlerinin başarım değerlendirmesi
GÖKHAN GÜLER
Yüksek Lisans
İngilizce
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. AHMET CÜNEYD TANTUĞ
- Derin öğrenme yöntemleri ile Türkçede bağlılık ayrıştırma
Dependency parsing with deep learning methods in Turkish
MÜCAHİT ALTINTAŞ
Doktora
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. AHMET CÜNEYD TANTUĞ
- Investigating the performance of segmentation methods with deep learning models for sentiment analysis on Turkish informal texts
Segmentasyon yöntemlerinin informal Türkçe metinlerde duygusal analiz için derin öğrenme modelleri ile kullanımında performans analizi
FATİH KURT
Yüksek Lisans
İngilizce
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiBilişim Sistemleri Ana Bilim Dalı
PROF. DR. PINAR KARAGÖZ
- Power of frequencies: N-grams and semi-supervised morphological segmentation in Turkish
Tekrarların gücü: Türkçe'de N-gramlar ve yarı-denetimli biçimbilimsel bölme
ÖZKAN KILIÇ
Doktora
İngilizce
2013
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiBilişsel Bilim Ana Bilim Dalı
PROF. DR. HÜSEYİN CEM BOZŞAHİN