A study on language modeling for Turkish large vocabulary continuous speech recognition
Türkçe geniş dağarcıklı sürekli konuşma tanıma için dil modelleme üzerine bir çalışma
- Tez No: 166835
- Danışmanlar: DR. MELTEM TURHAN YÖNDEM, DOÇ. DR. TOLGA ÇİLOĞLU
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Geniş Dağarcıklı Konuşma Tanıma, Eklemeli Diller, Dil Modelleri, İki Aşamalı Tanıma, Large Vocabulary Continuous Speech Recognition, Agglutinative Lan guages, Language Modeling, Two-pass Recognition IV
- Yıl: 2005
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 66
Özet
oz TÜRKÇE GENİŞ DAĞ ARCIKLI SÜREKLİ KONUŞMA TANIMA İÇİN DİL MODELLEME ÜZERİNE BİR ÇALIŞMA Bayer, Ali Orkan Yüksek Lisans, Bilgisayar Mühendisliği Bölümü Tez Yöneticisi : Dr. Meltem Turhan Yöndem Ortak Tez Yöneticisi : Doç. Dr. Tolga Çiloğlu Eylül 2005, 54 sayfa Bu çalışma Türkçe için geniş dağarcıklı sürekli konuşma tanıma problemine yönelmektedir. Türkçe için sürekli konuşma tanıma, dilin eklemeli yapısı nedeniyle iyi yapılamamaktadır. Dilin eklemeli doğası bu alanda kullanılan klasik dil modellerinin performansını düşürmektedir. Bu tez çalışmasında öncelikle değişik parametreler kullanılarak akustik modeller oluşturulmuştur ve test edilmiştir. Sonra üç tip n-gram dil modeli eğitilmiştir. Bu modeller sınıf tabanlı modelleri, gövde tabanlı modelleri ve gövde-ek-dizisi tabanlı modelleri kapsamaktadır. Hidden Markov Model Toolkit (HTK) kullanılarak sistemi önce bi-gram ve sonra da tri-gram modellerle test etmek için iki aşamalı tanıma yapılmıştır. Bu çalışmanın sonunda kelime dağarcığını kapsamaları nedeniyle, gövde ve ek dizileri üzerinden eğitilen modellerin daha iyi sonuç verdiği bulunmuştur.
Özet (Çeviri)
ABSTRACT A STUDY ON LANGUAGE MODELING FOR TURKISH LARGE VOCABULARY CONTINUOUS SPEECH RECOGNITION Bayer, Ali Orkan M.S., Department of Computer Engineering Supervisor : Dr. Meltem Turhan Yöndem Co-Supervisor : Assoc. Prof. Dr. Tolga Çiloğlu September 2005, 54 pages This study focuses on large vocabulary Turkish continuous speech recognition. Con tinuous speech recognition for Turkish cannot be performed accurately because of the agglutinative nature of the language. The agglutinative nature decreases the performance of the classical language models that are used in the area. In this thesis firstly, acoustic models using different parameters are constructed and tested. Then, three types of n-gram language models are built. These involve class-based models, stem-based models, and stem-end-based models. Two pass recognition is performed using the Hidden Markov Model Toolkit (HTK) for testing the system first with the bigram models and then with the trigram models. At the end of the study, it is found that trigram models over stems and endings give better results, since their coverage of the vocabulary is better.
Benzer Tezler
- Statistical and discriminative language modeling for Turkish large vocabulary continuous speech recognition
Türkçe geniş dağarcıklı konuşma tanıma için istatistiksel ve ayırıcı dil modellemesi
EBRU ARISOY
Doktora
İngilizce
2009
Elektrik ve Elektronik MühendisliğiBoğaziçi ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. MURAT SARAÇLAR
- Sub-word language modeling for Turkish speech recognition
Türkçe ses tanıma için sözcük altı dil modelleme
OSMAN BÜYÜK
Yüksek Lisans
İngilizce
2005
Elektrik ve Elektronik MühendisliğiSabancı ÜniversitesiElektrik ve Elektronik Mühendisliği Ana Bilim Dalı
YRD. DOÇ. HAKAN ERDOĞAN
- Evaluating the performance of different continous vector representation methods for turkish words
Türkçe sözcükler için farklı sürekli vektör temsilyöntemlerinin başarım değerlendirmesi
GÖKHAN GÜLER
Yüksek Lisans
İngilizce
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. AHMET CÜNEYD TANTUĞ
- Görsel dikkat modeli ve derin öğrenme yöntemleri kullanılarak geniş dağarcıklı ayrık işaret dili tanıma sisteminin modellenmesi
Modeling a large vocabulary isolated sign language recognition system using visual attention model and deep learning methods
ÖZGE MERCANOĞLU SİNCAN
Doktora
Türkçe
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAnkara ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. HACER YALIM KELEŞ
- The significance and the contribution of 6+1 traits of writing to the success of the students in writing courses in English language teaching
Yazmanın 6+1 özelliğinin İngilizce öğretiminde yazılı anlatım derslerindeki öğrenci başarısına katkısı ve önemi
ÖZLEM YAZAR
Yüksek Lisans
İngilizce
2004
Eğitim ve ÖğretimGazi Üniversitesiİngiliz Dili Eğitimi Ana Bilim Dalı
YRD. DOÇ. DR. PAŞA TEVFİK CEPHE