Sesbirim tabanlı Türkçe sesli ifade tanımada yazım hatası düzeltme sisteminin tasarımı ve gerçekleştirimi
Design and implementation of a spelling error correction system in phoneme based Turkish speech recognition
- Tez No: 105558
- Danışmanlar: YRD. DOÇ. DR. HARUN ARTUNER
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Türkçe sesli ifade tanıma, sesbirim kümeleme, yazım hatası düzeltme, Turkish speech recognition, phoneme clustering, spelling error correction
- Yıl: 2001
- Dil: Türkçe
- Üniversite: Hacettepe Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 115
Özet
SESBİRİM TABANLI TÜRKÇE SESLİ İFADE TANIMADA YAZIM HATASI DÜZELTME SİSTEMİNİN TASARIMI VE GERÇEKLEŞTİRİMİ Ali Özkan ÖZEREN Hacettepe Üniversitesi, Bilgisayar Mühendisliği Bölümü ÖZ Türkçe sesli ifade tanımada en uygun yöntem, Türkçe'nin çekimli bir dil olması nedeniyle, sesbirim tabanlı sesli ifade tanıma yöntemidir. Bu yöntemle gerçekleştirilen bir sesli ifade tanıma sistemi, hece ya da sözcük tabanlı sistemlere göre çok daha hızlı olmasına karşın, üretilen sözcüklerin doğruluk oranı düşüktür. Bir başka deyişle bu yöntemin, dilde var olmayan, hatalı sözcükler üretmesi olasıdır. Bu yüzden üretilen metinlerde oluşabilecek yazım hatalarının bulunup düzeltilmesi gerekir. Bu çalışma kapsamında, sesbirim tabanlı Türkçe sesli ifade tanıma sisteminin ürettiği sözcüklerde oluşabilecek yazım hatalarını bulup, düzelten sesbirime dayalı yazım hatası düzeltme uygulaması gerçekleştirilmiştir. Bu bağlamda, Türkçe sesbirimlerin birbirleriyle olan benzerlikleri hesaplanmış ve tanıma sürecinde hataya yol açabilecek sesbirim kümeleri belirlenmiştir. Buradan elde edilen sonuçlarla birlikte, yazım hatası düzeltme yaklaşımlarından biri olan en düşük düzeltme uzaklığı hesaplama yöntemi, sesli ifade tanımada oluşabilecek hatalar gözetilerek yeniden düzenlenmiştir. Bu bağlamda, her işlem için farklı bedel hesaplayan sesbirime dayalı en küçük düzeltme uzaklığı hesaplama yöntemi elde edilmiştir. Bu yöntemi kullanarak, deterministik sonlu durumlu özdevinir yapısında tutulan sözlük üzerinde hataya dayanıklı sonlu durum tanıma yaklaşımıyla hatalı sözcük için aday sözcükler bulunmuştur. Aynı zamanda sesbirim tabanlı sesli ifade tanıma sisteminin ürettiği birimin sözcük yerine hece olması durumu için hece düzeyinde yazım hatası düzeltme uygulaması geliştirilmiştir.
Özet (Çeviri)
DESIGN AND IMPLEMENTATION OF A SPELLING ERROR CORRECTION SYSTEM IN PHONEME BASED TURKISH SPEECH RECOGNITION Ali Özkan ÖZEREN Hacettepe University, Department of Computer Engineering ABSTRACT As most of the words in Turkish are produced by derivational and inflectional affixes to roots, phoneme based speech recognition is the most appropriate method for a Turkish speech recognition system. This type of speech recognition system is quite faster than the other methods such as word or syllable based systems. But beside this, producing non-words, those donot exist in the language, is the drawback of this method. That's why, a spelling error correction process should be done on the words, produced by a phoneme based speech recognition system. This work involves an implementation of a phoneme based spelling error correction system to correct the possible spelling errors on the words produced by a phoneme based Turkish speech recognition system. Within this context, the similarities of the Turkish phonemes are calculated and the most confusable pairs, which can cause possible spelling errors, are determined. By using the data obtained from this work, some changes made on the minimum edit distance calculation method. Within this context, phoneme based minimum edit distance calculation method had been extracted by assigning different costs to each editing operation. By using this method, an error-tolerant spelling error correction is made with a dictionary, which is saved in a deterministic finite state automata structure. Beside this, for the recognition systems, those produce syllables rather than words, another spelling error correction system is proposed and implemented.
Benzer Tezler
- Türkçe sesli ifade tanımada ses birim ve heceye dayalı çözümleme ve iyileştirmenin yapıldığı bir uzman sistemin tasarım ve gerçekleştirimi
Design and implementation of an expert system for analysis and optimization of Turkish speech recognition based on phoneme and syllable
SONER ERKAN YASAN
Yüksek Lisans
Türkçe
2001
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. HARUN ARTUNER
- Türkçe ses birimlerinin sınıflandırılması için bir bulanık sinir ağının tasarımı ve gerçekleştirimi
Design and implementation of a fuzzy neural network for Turkish phoneme classification
ETHEM ARKIN
Yüksek Lisans
Türkçe
2004
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
Y.DOÇ.DR. HARUN ARTUNER
- Ötümlü konuşma sesi kalıntı sinyallerinin 1/F özelliğinin incelenmesi
Analysis of 1/F characteristics of voiced speech residual signal
SÜLEYMAN BAYKUT
Yüksek Lisans
Türkçe
2004
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. TAYFUN AKGÜL
- Sesbirim tabanlı konuşulan dilin tanınması
Speaker independent phoneme based spoken language recognition system
KAMİL ÖNCÜ ŞEN
Yüksek Lisans
Türkçe
2007
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKaradeniz Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. CEMAL KÖSE
- Modeling phoneme durations and fundamental frequency contours in Turkish speech
Türkçe konuşmada sesbirim sürelerinin ve temel frekans eğrimlerinin modellenmesi
ÖZLEM ÖZTÜRK
Doktora
İngilizce
2005
Elektrik ve Elektronik MühendisliğiOrta Doğu Teknik ÜniversitesiElektrik ve Elektronik Mühendisliği Bölümü
DOÇ.DR. TOLGA ÇİLOĞLU