Geri Dön

Sesbirim tabanlı Türkçe sesli ifade tanımada yazım hatası düzeltme sisteminin tasarımı ve gerçekleştirimi

Design and implementation of a spelling error correction system in phoneme based Turkish speech recognition

  1. Tez No: 105558
  2. Yazar: ALİ ÖZKAN ÖZEREN
  3. Danışmanlar: YRD. DOÇ. DR. HARUN ARTUNER
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Türkçe sesli ifade tanıma, sesbirim kümeleme, yazım hatası düzeltme, Turkish speech recognition, phoneme clustering, spelling error correction
  7. Yıl: 2001
  8. Dil: Türkçe
  9. Üniversite: Hacettepe Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 115

Özet

SESBİRİM TABANLI TÜRKÇE SESLİ İFADE TANIMADA YAZIM HATASI DÜZELTME SİSTEMİNİN TASARIMI VE GERÇEKLEŞTİRİMİ Ali Özkan ÖZEREN Hacettepe Üniversitesi, Bilgisayar Mühendisliği Bölümü ÖZ Türkçe sesli ifade tanımada en uygun yöntem, Türkçe'nin çekimli bir dil olması nedeniyle, sesbirim tabanlı sesli ifade tanıma yöntemidir. Bu yöntemle gerçekleştirilen bir sesli ifade tanıma sistemi, hece ya da sözcük tabanlı sistemlere göre çok daha hızlı olmasına karşın, üretilen sözcüklerin doğruluk oranı düşüktür. Bir başka deyişle bu yöntemin, dilde var olmayan, hatalı sözcükler üretmesi olasıdır. Bu yüzden üretilen metinlerde oluşabilecek yazım hatalarının bulunup düzeltilmesi gerekir. Bu çalışma kapsamında, sesbirim tabanlı Türkçe sesli ifade tanıma sisteminin ürettiği sözcüklerde oluşabilecek yazım hatalarını bulup, düzelten sesbirime dayalı yazım hatası düzeltme uygulaması gerçekleştirilmiştir. Bu bağlamda, Türkçe sesbirimlerin birbirleriyle olan benzerlikleri hesaplanmış ve tanıma sürecinde hataya yol açabilecek sesbirim kümeleri belirlenmiştir. Buradan elde edilen sonuçlarla birlikte, yazım hatası düzeltme yaklaşımlarından biri olan en düşük düzeltme uzaklığı hesaplama yöntemi, sesli ifade tanımada oluşabilecek hatalar gözetilerek yeniden düzenlenmiştir. Bu bağlamda, her işlem için farklı bedel hesaplayan sesbirime dayalı en küçük düzeltme uzaklığı hesaplama yöntemi elde edilmiştir. Bu yöntemi kullanarak, deterministik sonlu durumlu özdevinir yapısında tutulan sözlük üzerinde hataya dayanıklı sonlu durum tanıma yaklaşımıyla hatalı sözcük için aday sözcükler bulunmuştur. Aynı zamanda sesbirim tabanlı sesli ifade tanıma sisteminin ürettiği birimin sözcük yerine hece olması durumu için hece düzeyinde yazım hatası düzeltme uygulaması geliştirilmiştir.

Özet (Çeviri)

DESIGN AND IMPLEMENTATION OF A SPELLING ERROR CORRECTION SYSTEM IN PHONEME BASED TURKISH SPEECH RECOGNITION Ali Özkan ÖZEREN Hacettepe University, Department of Computer Engineering ABSTRACT As most of the words in Turkish are produced by derivational and inflectional affixes to roots, phoneme based speech recognition is the most appropriate method for a Turkish speech recognition system. This type of speech recognition system is quite faster than the other methods such as word or syllable based systems. But beside this, producing non-words, those donot exist in the language, is the drawback of this method. That's why, a spelling error correction process should be done on the words, produced by a phoneme based speech recognition system. This work involves an implementation of a phoneme based spelling error correction system to correct the possible spelling errors on the words produced by a phoneme based Turkish speech recognition system. Within this context, the similarities of the Turkish phonemes are calculated and the most confusable pairs, which can cause possible spelling errors, are determined. By using the data obtained from this work, some changes made on the minimum edit distance calculation method. Within this context, phoneme based minimum edit distance calculation method had been extracted by assigning different costs to each editing operation. By using this method, an error-tolerant spelling error correction is made with a dictionary, which is saved in a deterministic finite state automata structure. Beside this, for the recognition systems, those produce syllables rather than words, another spelling error correction system is proposed and implemented.

Benzer Tezler

  1. Türkçe sesli ifade tanımada ses birim ve heceye dayalı çözümleme ve iyileştirmenin yapıldığı bir uzman sistemin tasarım ve gerçekleştirimi

    Design and implementation of an expert system for analysis and optimization of Turkish speech recognition based on phoneme and syllable

    SONER ERKAN YASAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2001

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. HARUN ARTUNER

  2. Türkçe ses birimlerinin sınıflandırılması için bir bulanık sinir ağının tasarımı ve gerçekleştirimi

    Design and implementation of a fuzzy neural network for Turkish phoneme classification

    ETHEM ARKIN

    Yüksek Lisans

    Türkçe

    Türkçe

    2004

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    Y.DOÇ.DR. HARUN ARTUNER

  3. Ötümlü konuşma sesi kalıntı sinyallerinin 1/F özelliğinin incelenmesi

    Analysis of 1/F characteristics of voiced speech residual signal

    SÜLEYMAN BAYKUT

    Yüksek Lisans

    Türkçe

    Türkçe

    2004

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    PROF. DR. TAYFUN AKGÜL

  4. Sesbirim tabanlı konuşulan dilin tanınması

    Speaker independent phoneme based spoken language recognition system

    KAMİL ÖNCÜ ŞEN

    Yüksek Lisans

    Türkçe

    Türkçe

    2007

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKaradeniz Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. CEMAL KÖSE

  5. Modeling phoneme durations and fundamental frequency contours in Turkish speech

    Türkçe konuşmada sesbirim sürelerinin ve temel frekans eğrimlerinin modellenmesi

    ÖZLEM ÖZTÜRK

    Doktora

    İngilizce

    İngilizce

    2005

    Elektrik ve Elektronik MühendisliğiOrta Doğu Teknik Üniversitesi

    Elektrik ve Elektronik Mühendisliği Bölümü

    DOÇ.DR. TOLGA ÇİLOĞLU