An optimized text-independent speaker recognition system using feed forward neural network
Optimize edilmiş ileri yapay sinir ağı kullanılan metinden bağımsız konuşmacı anıma sistemi
- Tez No: 637268
- Danışmanlar: DR. ÖĞR. ÜYESİ FERHAT ATASOY
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2020
- Dil: İngilizce
- Üniversite: Karabük Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 72
Özet
Konuşmacı Tanıma Süreci, konuşmacı modellemesi için kritik olan çeşitli zorluklara sahiptir. Konuşmacı tanımlamasındaki ana engel, ses sinyallerinin doğasıdır. Bu tür sinyaller, konuşmanın elektrik özelliklerinin zamanla değişen doğasından kaynaklanabilecek rastgele olma doğası ile adlandırılır. Konuşmanın spektral bilgisi fazla zamana göre değişir; bu nedenle, hoparlör tanıma sürecinde bir sistemi modellemek için sadece spektral alana güvenmek zordur. Metinden bağımsız konuşmacı tanımada; hoparlörleri tanımak için frekans bileşen analizi kullanılır. Ses sinyalleri zamanla değişen sinyal olduğundan frekans spektrumu bilgisi de zamanla değişir. Bu çalışmada, metinden bağımsız hoparlör tanıma sistemi yaklaşımı önermek için Temel Frekans ile birlikte Mel Frekans Cepstral Katsayısı (MFCC) uygulanmıştır. Ayrıca, hoparlör tahmini amacıyla Feed Forward Sinir Ağı (FFNN) uygulanmıştır. Performansı daha da artırmak için, Parçacık Sürüsü optimizasyonu algoritması Freezing-FFNN ile entegre edilmiştir. Yeni önerilen tekniği simülasyon sonuçları yani PSO-FFNN'nin % 83,4 oranında doğruluk elde ettiğini ve Ortalama Kare Hatasını önemli ölçüde azalttığını göstermiştir.
Özet (Çeviri)
Speaker Recognition Process is susceptible for a several challenges which are critical to speaker modelling. The main obstacle in speaker identification is the nature of voice signals. Such signals are termed by their randomness nature which can be caused by the time-varying nature of speech electric properties. The spectral information of speech varies overtime; therefore, it is difficult to rely only on the spectral domain in order to model a system for speaker recognition. In text-independent speaker recognition; frequency component analysis used to recognize the speakers. As voice signals are time-variant signal, the frequency spectrum information is changing by time. In this study, Mel Frequency Cepstral Coefficient (MFCC) alongside Fundamental Frequency are implemented to propose text-independent speaker recognition system approximation. In addition, Feed Forward Neural Network (FFNN) is applied for speaker prediction purpose. To further improve the performance, particle Swarm optimization algorithm was integrated by Freezing-FFNN. The simulation has shown that newly proposed technique, namely PSO-FFNN has achieved accuracy by 83,4 % and reduced the Mean Square Error significantly.
Benzer Tezler
- Sembolik devre analizi
Sembolic circuit analysis
RECAİ OKTAŞ
Yüksek Lisans
Türkçe
1997
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. HAKAN KUTMAN
- Websitelerinin kullanılabilirlik değerlendirmesi
Usability evaluation of websites
NEVCİHAN TORAMAN
Doktora
Türkçe
2024
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. ÇİĞDEM ALTIN GÜMÜŞSOY
- Banyo tasarımı için kural tabanlı uzman sistem
A Rule-based expert system for bathroom design
ÇELİK İNGİN
Yüksek Lisans
Türkçe
1997
Mimarlıkİstanbul Teknik ÜniversitesiMimarlık Ana Bilim Dalı
PROF. DR. NİGAN BAYAZIT
- Markov ve Gibbs rastlantı alan modelleri ile doku sentezleme ve sınıflandırma
Texture synthesis and classification using Markov and Gibbs random field models
ERDOĞAN CAMCIOĞLU
Yüksek Lisans
Türkçe
1990
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiPROF. DR. ERDAL PANAYIRCI
- Toplum 5.0 kapsamında yapay zekaya dayalı reklamların tüketici temelli marka değerine etkisi üzerine bir araştırma
A study on the impact of ai-created advertisements on consumer-based brand equity in the scope of Society 5.0
ECE ERTAN
Yüksek Lisans
Türkçe
2022
İşletmeGalatasaray Üniversitesiİşletme Ana Bilim Dalı
DOÇ. DR. NEVİN KARABIYIK YERDEN