Investigation of automatically derived subword units for turkish LVCSR
Türkçe GDSKT için otomatik olarak elde edilmiş kelime altı modellerin incelenmesi
- Tez No: 232620
- Danışmanlar: YRD. DOÇ. MURAT SARAÇLAR
- Tez Türü: Yüksek Lisans
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2008
- Dil: İngilizce
- Üniversite: Boğaziçi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektrik ve Elektronik Mühendisliği Bölümü
- Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
- Sayfa Sayısı: 58
Özet
Bu tezde, Türkçe için uygun ve başarılı bir dil modeli yaratma yaklaşımı gerçekleştirebilmek amacıyla, farklı tanıma birimleri temel alınarak oluşturulmuş dil modelleri kullanılarak geniş dağarcıklı sürekli konuşma tanıma (GDSKT) deneyleri gerçekleştirilmiştir. Türkçe çok eklemeli bir dil olduğundan dolayı, dil modelinin nasıl oluşturulduğu tanıma başarımını ciddi şekilde etkilemektedir. Geleneksel kelime tabanlı dil modelleri İngilizce için iyi sonuçlar verirken, Türkçe'de, Türkçe'nin eklemeli yapısından ötürü, iyi çalışmamaktadırlar. Bu problemle başa çıkabilmek için, genel olarak morfem ve kök-kök sonrası kelime altı birimlerine dayanan, farklı kelime modelleme stratejileri önerilmiştir. Bu çalışmada eğitmensiz şekilde elde edilmiş kelime altı birimler incelenmiştir. Farklı yaklaşımlarla elde edilen bölütlemeler konuşma tanıma aşamasındaki performansları dikkate alınarak karşılaştırılmıştır. En iyi kelime hata oranı 25.24 olarak elde edilmiştir. Aynı deneyde kelime tabanlı dil modelleri kullanıldığında ise kelime hata oranı 26.90 olarak elde edilmiştir.
Özet (Çeviri)
In this thesis, we performed large vocabulary continuous speech recognition (LVCSR) experiments using language models that are built upon different recognition units in order to create a suitable and successful language modeling scheme for Turkish. Since Turkish is an agglutinative language, how you build the language model drastically affects the recognition performance. Whereas traditional word based language models give satisfactory results for English; they do not work well for Turkish due to the inductive morphology. Different language modeling strategies, mainly based on sub-word units like morphemes and stem-endings, are proposed in order to overcome this problem. In this work, the sub-words that are derived in an unsupervised manner, are investigated. Segmentation obtained using different approaches are compared due to their performance in speech recognition. The best WER that has been obtained is 25.24 whereas it has been obtained as 26.90 using the word-based language models.
Benzer Tezler
- Elastik zemine oturan betonarme kirişlerin elasto-plastik davranışının incelenmesi yapı sistemlerinin hesap yöntemlerinin karşılaştırılması
Investigation of elastic-plastic behaviour of concrete beams on elastic foundation-comparison of methods of structural analysis
İBRAHİM BAKAN
- Perdeli kirişsiz döşemelerde efektif genişliğin incelenmesi yapı sistemlerinin hesap yöntemlerinin karşılaştırılması
Başlık çevirisi yok
GÖKAY AHMET GÜLEKEN
- Dikey bir porselen levhadan taşınımla eşzamanlı ısı ve kütle geçişi olaylarının teorik & ampirik bağıntılar ve dijital görüntü işleme kullanılarak incelenmesi
Investigation of convective heat and mass transfer phenomena from a vertical plate by using empirical correlations and digital image processing
AYKUT EFE
Yüksek Lisans
Türkçe
2023
Makine Mühendisliğiİstanbul Teknik ÜniversitesiMakine Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ MURAT ÇAKAN
- Computer aided investigation of non ideal situations of linear circuits containing periodically operated swiches; aplications to switched-capacitor networks
Peryodik olarak çalışan anahtarlar içeren lineer devrelerin ideal olmayan durumlarının incelenmesi; anahtarlanmış kapasitör devrelerinde uygulamalar
TALAT KILCI
Doktora
İngilizce
1993
Elektrik ve Elektronik MühendisliğiOrta Doğu Teknik ÜniversitesiElektrik ve Elektronik Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. ARİF NACAROĞLU
- Kömürün kendi kendine ısınmasının ve tutuşmasının modellenmesi, simülasyonu ve deneysel incelenmesi
Mathematical modelling, simulation and experimental investigation of self – heating and self – ignition of coal
BURHAN YÖRÜK
Doktora
Türkçe
2021
Makine Mühendisliğiİstanbul Teknik ÜniversitesiMakine Mühendisliği Ana Bilim Dalı
PROF. DR. AHMET ARISOY