Variable sized input multi layer perceptrons for speech recognition
Değişken boyutlu girdili çok katmanlı perceptronlar ile ses tanıma
- Tez No: 95414
- Danışmanlar: DOÇ. DR. ETHEM ALPAYDIN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2000
- Dil: İngilizce
- Üniversite: Boğaziçi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 97
Özet
ÖZET DEĞİŞKEN BOYUTLU GİRDİLİ ÇOK KATMANLI PERCEPTRONLAR İLE SES TANIMA İlk olarak, popüler istatistiksel ve sinirsel yöntemler olan, Saklı Markov Modelleri (HMM), k- Yalan Komşu, Tek ve Çok-Katmanlı Perceptronlar (MLP), Radyal-Tabanlı Fonksiyonlar, ve Uzmanlar Karışımları, ses sınıflandırma problemi üzerinde karşılaştırıldı. İstatistiksel yöntemler benzerlik tabanlı, sinir ağlan ise ayırt edici şekilde eğitilir. HMM, sesi, geçici sinyaller olarak modellerken, diğer yöntemler zaman gecikmesi kullanarak, zamanı uzaya izdüşürürler ve tüm sinyali tek bir vektör olarak gösterirler. Bu yüzden, bu metodlann girdileri sabit uzunlukta olmalıdır. Değişken uzunlukta sesbirimlerinin sınıflandırılmasında, MLP'nin ayırt edici gücünden faydalamlabilmesi için, özel eğitilmiş MLP'lerden oluşan, Değişken Boyutlu Girdili Çok Katmanlı Perceptronlar (VSIMLP) metodu önerildi. Birbirine yakın altı Japon sesbirimini, /b,d,g,m,n,N/, içeren veriseti, yukarıda adı geçen yöntemlerin karşılaştırılmasında kullanıldı. VSIMLP metodu, UMU 39-sınıf sesbirimi tanıma problemi üzerinde test edildi. Girdi uzayının fazla boyutluluğu ve ses sentez fizyolojisi sebepleriyle, yerel yöntemlerin, ses tanıma probleminde önemli bir yeri olduğu sonucuna varıldı. VSIMLP-HMM melez yöntemlerinin kelime veya cümle tanımada kullanışlı olduğu ve VSMLP'nin temel aldığı fikirlerin, MLP yerine, yerel yöntemlere de uygulanabileceği görüldü.
Özet (Çeviri)
IV ABSTRACT VARIABLE SIZED INPUT MULTI LAYER PERCEPTRONS FOR SPEECH RECOGNITION First, we review popular statistical and neural methods for classification, which are Hidden Markov Models (HMM), ^-Nearest Neighbor, Single and Multi-Layer Perceptrons (MLP), Radial-Basis Functions, and Mixture of Experts. Then, we apply them to the classification of speech phonemes. The statistical methods are likelihood-based, whereas neural network methods are trained discriminatively. HMMs model the speech as a temporal signal whereas the other methods map time to space using time-delay and represent the whole signal as one vector. Therefore, the input to the latter systems should be of a fixed length. To make use of the discriminative power of MLPs for classification of variable length phonemes, we propose Variable Sized Input Multi Layer Perceptrons (VSIMLP), which is composed of a set of special-type MLPs. The database used for the review part contains instances from six closely pronounced Japanese phonemes, /b,d,g,m,n,N/. We test VSIMLP on the ITMIT 39-class phoneme problem. We conclude that focusing on the localities is an important issue in phoneme recognition because of the high dimensionality of input space and the nature of speech synthesis. We also conclude that VSIMLP is a promising and extendable technique for phoneme classification. The idea of VSIMLP can be applied to local models with better feature vectors, and it can be used with HMM as a hybrid method to classify words or sentences.
Benzer Tezler
- Analysis and synthesis of reflectarray antenna
Yansıtıcı dizi anten analiz ve sentezi
SELAHATTİN NESİL
Doktora
İngilizce
2014
Elektrik ve Elektronik MühendisliğiYıldız Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. FİLİZ GÜNEŞ
PROF. DR. BAHATTİN TÜRETKEN
- A fast 3d flow field prediction around bluff bodies using deep learning
Derin öğrenme kullanılarak küt cisimler etrafındaki 3 boyutlu akış alanının tahmini
FARHAD NEMATI TAHER
Yüksek Lisans
İngilizce
2023
Makine Mühendisliğiİstanbul Teknik ÜniversitesiMakine Mühendisliği Ana Bilim Dalı
DOÇ. DR. ABDUSSAMET SUBAŞI
- Yapay sinir ağları ile trafik yoğunluğu tahmini
Prediction of traffic congestion by artificial neural networks
MURAT NAS
Yüksek Lisans
Türkçe
2024
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. NESLİHAN SERAP ŞENGÖR
- Hava durumu tahmini için veri madenciliği tabanlı bir model geliştirilmesi
Development of a data mining based model for weather forecasting
YUNUS EMRE CEBECİ
Yüksek Lisans
Türkçe
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. ŞULE ÖĞÜDÜCÜ
- Multivariate decision trees for machine learning
Yapay öğrenmede çok değişkenli karar ağaçları
OLCAY TANER YILDIZ
Yüksek Lisans
İngilizce
2000
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ.DR. ETHEM ALPAYDIN