Geri Dön

Konuşmacıya bağımlı ayrık sözcük tanıma

Speaker dependent isolated word recognition

  1. Tez No: 338745
  2. Yazar: TAYFUN ÖZİŞBAKAN
  3. Danışmanlar: PROF. DR. MÜZEYYEN SARITAŞ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2011
  8. Dil: Türkçe
  9. Üniversite: Gazi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 91

Özet

Sayısal işaret işleme ve bilgisayar teknolojisindeki gelişmeler, ses işaretlerinin depolanmasını, sıkıştırılmasını, sentezlenmesini, tanınmasını ve tekrar oluşturulmasını mümkün kılmaktadır. Konuşmacıya bağımlı ayrık sözcük tanıma çalışmasında, ses örneklerine ait temel ses parametrelerinin çıkartılması için, Doğrusal Öngörülü Kodlama, DÖK, (Linear Predictive Coding, LPC) ve Mel-Frekansı Kepstral Katsayılar, MFKK, (Mel-Frequency Cepstrum Coefficients, MFCC) yöntemlerinden faydaylanıldı ve bu iki yöntem ile elde edilen sonuçlar karşılaştırıldı. Kullanıcı, alıştırma evresinde, sözcüklerin sisteme depolanmasını sağlar. Analog ses işaretleri, sayısala dönüştürülüp uygun biçimde depolandıktan sonra, temel ses parametreleri çıkartılır. Sözcük tanıma evresinde, sistem, kullanıcı tarafından söylenen kelimeleri tahmin etmeye çalışır. Örnek sözcük şabonlarına ait ses parametre vektörleri ile tanınmaya çalışılan sözcük ses parametre vektörleri arasındaki en kısa mesafe, Dinamik Zaman Çakıştırma, DZÇ, (Dynamic Time Warping, DTW) yöntemiyle araştırılır. Bu çalışma, bilgisayar destekli bir sistem olarak uyarlandı ve Matlab teknik programlama dili kullanıldı. Sistem performasını ölçebilmek için, ayrık sözcükler olarak Türkçe ve İngilizce'deki 0'dan 9'a kadar olan sayılar seçildi. İngilizce sayıları tanımada başarı oranı % 85-95 arasında gerçekleşirken, Türkçe sayıları tanımada başarı oranı %75-90 arasında gerçekleşti. MFCC yönteminin, LPC yöntemine oranla daha başarılı sonuçlar verdiği gözlendi. Ayrıca, ortam gürültüsünün, sözcük tanımaya olan olumsuz etkisini azaltmak için uygun teknikler araştırıldı. Gürültü süzme amaçlı olarak, Ayrık Dalgacık Dönüşümü, ADD, kullanıldı. ADD kullanıldığında, Türkçe sözcük tanımadaki başarının İngilizce sözcük tanımaya yaklaştığı görüldü.Anahtar Kelimeler : Sözcük tanıma, Doğrusal Öngörülü Kodlama, Mel- Frekans Kepstrum Katsayıları, Dinamik Zaman Çakıştırma

Özet (Çeviri)

Recent developments in digital signal processing and computer technologies have made speech signals to be stored, to be compressed, to be synthesized and to be recognized digitally possible. In speaker dependent isolated word recognition implementation, two methods have been utilized in feature extraction of speech signals: Linear Predictive Coding, LPC, and Mel-Frequency Cepstrum Coefficients, MFCC. The results by LPC and MFCC are compared. After the speech signals are converted from analog to digital and stored in appropriate format, the basic parameters of speech features are extracted. The minimum distance between feature parameter vectors of the template words and the feature parameter vectors of word to be recognized is calculated by Dynamic Time Warping, DTW, method. Speaker dependent isolated word recognition is implemented on computer based system. In the training phase, a user records the words in computer. In word recognition phase, system tries to recognize which word is uttered by the user. Matlab technical computation programming language is used for this study. In order to measure the performance of system, isolated words are chosen the numbers between 0 and 9 from Turkish and English language. English numbers are recognized by 85-95 % and Turkish numbers are recognized by 75-90 %. In general, MFCC method has much better performance than LPC method to recoginize isolated words. An appropriate method has been investigated in order to eleminate the negative effect of background noise on the word recoginition. In denoising the speech signal, Discrete Wavelet Tranformation, DWT, is utilized. It is observed that with the combined use of DWT in recording, the performance of Turkish isolated word recognition is very near to the performance of English isolated word recognition.Key Words : Word recognition, Linear Predictive Coding, Mel-Frequency Cepstrum Coefficients

Benzer Tezler

  1. Bilgisayar yardımıyla ayrık sözcük tanıma sistem algoritmalarının incelenmesi

    Examination of the isolated word recognition system algoritms constructed by computer

    Z.HAKAN AKPOLAT

    Yüksek Lisans

    Türkçe

    Türkçe

    1992

    Elektrik ve Elektronik MühendisliğiFırat Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. MUSTAFA POYRAZ

  2. Isolated word recognition using time-delay neural networks

    Zaman gecikmeli nöron ağları kullanılarak ayrık sözcük tanıma

    ALP ALİM

  3. Türkçeden seçilmiş bir grup kelimenin robot kolu kontrolünde kullanılması

    Use of group word chosen from Turkish in robot arm control

    FİKRET ATA

    Doktora

    Türkçe

    Türkçe

    1996

    Elektrik ve Elektronik MühendisliğiFırat Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    Y.DOÇ.DR. MUSTAFA POYRAZ

  4. Design and implementation of Turkish speech recognition engine

    Türkçe konuşma tanıma sisteminin tasarımı ve gerçekleştirilimi

    RIFAT AŞLIYAN

    Doktora

    İngilizce

    İngilizce

    2008

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolDokuz Eylül Üniversitesi

    Bilgisayar Mühendisliği Bölümü

    PROF. DR. TATYANA YAKHNO