Konuşmacıya bağımlı ayrık sözcük tanıma
Speaker dependent isolated word recognition
- Tez No: 338745
- Danışmanlar: PROF. DR. MÜZEYYEN SARITAŞ
- Tez Türü: Yüksek Lisans
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2011
- Dil: Türkçe
- Üniversite: Gazi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 91
Özet
Sayısal işaret işleme ve bilgisayar teknolojisindeki gelişmeler, ses işaretlerinin depolanmasını, sıkıştırılmasını, sentezlenmesini, tanınmasını ve tekrar oluşturulmasını mümkün kılmaktadır. Konuşmacıya bağımlı ayrık sözcük tanıma çalışmasında, ses örneklerine ait temel ses parametrelerinin çıkartılması için, Doğrusal Öngörülü Kodlama, DÖK, (Linear Predictive Coding, LPC) ve Mel-Frekansı Kepstral Katsayılar, MFKK, (Mel-Frequency Cepstrum Coefficients, MFCC) yöntemlerinden faydaylanıldı ve bu iki yöntem ile elde edilen sonuçlar karşılaştırıldı. Kullanıcı, alıştırma evresinde, sözcüklerin sisteme depolanmasını sağlar. Analog ses işaretleri, sayısala dönüştürülüp uygun biçimde depolandıktan sonra, temel ses parametreleri çıkartılır. Sözcük tanıma evresinde, sistem, kullanıcı tarafından söylenen kelimeleri tahmin etmeye çalışır. Örnek sözcük şabonlarına ait ses parametre vektörleri ile tanınmaya çalışılan sözcük ses parametre vektörleri arasındaki en kısa mesafe, Dinamik Zaman Çakıştırma, DZÇ, (Dynamic Time Warping, DTW) yöntemiyle araştırılır. Bu çalışma, bilgisayar destekli bir sistem olarak uyarlandı ve Matlab teknik programlama dili kullanıldı. Sistem performasını ölçebilmek için, ayrık sözcükler olarak Türkçe ve İngilizce'deki 0'dan 9'a kadar olan sayılar seçildi. İngilizce sayıları tanımada başarı oranı % 85-95 arasında gerçekleşirken, Türkçe sayıları tanımada başarı oranı %75-90 arasında gerçekleşti. MFCC yönteminin, LPC yöntemine oranla daha başarılı sonuçlar verdiği gözlendi. Ayrıca, ortam gürültüsünün, sözcük tanımaya olan olumsuz etkisini azaltmak için uygun teknikler araştırıldı. Gürültü süzme amaçlı olarak, Ayrık Dalgacık Dönüşümü, ADD, kullanıldı. ADD kullanıldığında, Türkçe sözcük tanımadaki başarının İngilizce sözcük tanımaya yaklaştığı görüldü.Anahtar Kelimeler : Sözcük tanıma, Doğrusal Öngörülü Kodlama, Mel- Frekans Kepstrum Katsayıları, Dinamik Zaman Çakıştırma
Özet (Çeviri)
Recent developments in digital signal processing and computer technologies have made speech signals to be stored, to be compressed, to be synthesized and to be recognized digitally possible. In speaker dependent isolated word recognition implementation, two methods have been utilized in feature extraction of speech signals: Linear Predictive Coding, LPC, and Mel-Frequency Cepstrum Coefficients, MFCC. The results by LPC and MFCC are compared. After the speech signals are converted from analog to digital and stored in appropriate format, the basic parameters of speech features are extracted. The minimum distance between feature parameter vectors of the template words and the feature parameter vectors of word to be recognized is calculated by Dynamic Time Warping, DTW, method. Speaker dependent isolated word recognition is implemented on computer based system. In the training phase, a user records the words in computer. In word recognition phase, system tries to recognize which word is uttered by the user. Matlab technical computation programming language is used for this study. In order to measure the performance of system, isolated words are chosen the numbers between 0 and 9 from Turkish and English language. English numbers are recognized by 85-95 % and Turkish numbers are recognized by 75-90 %. In general, MFCC method has much better performance than LPC method to recoginize isolated words. An appropriate method has been investigated in order to eleminate the negative effect of background noise on the word recoginition. In denoising the speech signal, Discrete Wavelet Tranformation, DWT, is utilized. It is observed that with the combined use of DWT in recording, the performance of Turkish isolated word recognition is very near to the performance of English isolated word recognition.Key Words : Word recognition, Linear Predictive Coding, Mel-Frequency Cepstrum Coefficients
Benzer Tezler
- Bilgisayar yardımıyla ayrık sözcük tanıma sistem algoritmalarının incelenmesi
Examination of the isolated word recognition system algoritms constructed by computer
Z.HAKAN AKPOLAT
Yüksek Lisans
Türkçe
1992
Elektrik ve Elektronik MühendisliğiFırat ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. MUSTAFA POYRAZ
- Isolated word recognition using time-delay neural networks
Zaman gecikmeli nöron ağları kullanılarak ayrık sözcük tanıma
ALP ALİM
Yüksek Lisans
İngilizce
1991
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiPROF.DR. NEŞE YALABIK
- Türkçeden seçilmiş bir grup kelimenin robot kolu kontrolünde kullanılması
Use of group word chosen from Turkish in robot arm control
FİKRET ATA
Doktora
Türkçe
1996
Elektrik ve Elektronik MühendisliğiFırat ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
Y.DOÇ.DR. MUSTAFA POYRAZ
- Design and implementation of Turkish speech recognition engine
Türkçe konuşma tanıma sisteminin tasarımı ve gerçekleştirilimi
RIFAT AŞLIYAN
Doktora
İngilizce
2008
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolDokuz Eylül ÜniversitesiBilgisayar Mühendisliği Bölümü
PROF. DR. TATYANA YAKHNO
- Speech recognition based on pattern comparison techniques
Başlık çevirisi yok
OSMAN MERAL
Yüksek Lisans
İngilizce
1996
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiDOÇ.DR. BÜLENT ÖRENCİK