Independent component analysis as a front-end for speaker recognition
Bağımsız parça analizinin konuşmacı tanıma sistemleri için ön işlemci olarak kullanılması
- Tez No: 152560
- Danışmanlar: PROF. DR. FİKRET GÜRGEN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2004
- Dil: İngilizce
- Üniversite: Boğaziçi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 59
Özet
ÖZET BAĞIMSIZ PARÇA ANALİZİNİN KONUŞMACI TANIMA SİSTEMLERİ İÇİN ÖN İŞLEMCİ OLARAK KULLANILMASI Günümüz konuşmacı tanıma sistemleri, genellikle labaratuvar koşullarında kaydedilmiş yüksek kalitede ses örnekleri girdi olarak kullanıldığında, yüksek performans göstermektedir. Fakat gerçek koşullar altında, çevreden gelen gürültü, müzik ve diğer konuşmalar gibi etkenler, performansı büyük oranda düşürmekte ve ciddi bir problem oluşturmaktadır. Konuşmacı tanıma sistemlerinin performansım arttırmak için ses örneğinin kalitesini, sisteme girilmeden önce konuşmacıya ait kısımlarını, orjinal ses karışımından ayırarak arttırmak çok önemlidir. Bu tezde yapılan çalışma, bağımsız parça analizinin (BPA) konuşmacı tanıma sistemleri için ön işlemci olarak kullanılarak, ses karışımlarını kaynak sinyallerine ayırmak ve gerçek koşullar altmda“kokteyl parti problemi”ni kaynak konuşma sinyalini, otomatik konuşmacı onaylama sistemi ile kullanarak çözmek için yapılan deneylerin sonuçlarını anlatmaktadır. Deneylerde YOHO veritabanı [15] kullanılmıştır. Önerilen metodun verimliliğini göstermek için konuşma, gürültü ve müzik ile karıştırılmış ses örneklerinden elde edilen performanslar gösterilmiştir. Ayrıca, değişik BPA metodlannm performansım karşılaştırmak için birkaç BPA algoritması kullanılmıştır. Yapılan deneylerin bir sonucu olarak; EGLD-ICA ve Fast-ICA gibi BPA algoritmalarının, ses kanşımlanm kaynak sinyallere ayırmak ve böylece tanıma işleminin performansım arttırmak için, konuşmacı tanıma sistemlerinde ön işlemci olarak kullanılabilecekleri başarıyla gösterilmiştir.
Özet (Çeviri)
IV ABSTRACT INDEPENDENT COMPONENT ANALYSIS AS A FRONT-END FOR SPEAKER RECOGNITION Current speaker recognition (SR) systems show high performance when high- quality speech samples, usually recorded in laboratory conditions, are used as input. However in real world experiments, interfering sounds in the environment (noise, music, other speakers etc.) degrades the performance and presents a serious challenge. To improve the performance of SR systems, it is important to improve the quality of speech input before being introduced into a SR system by separating those portions of speech that belong to testing speaker from the original sound mixture. The work in this thesis reports the results of experiments on using independent component analysis (ICA) as a front-end processing for SR to decompose sound mixtures into source signals and interfacing source speech signal with automatic speaker authentication system to overcome the“cocktail party problem”in real-world environments. In experiments, YOHO database [15] is used. The performances with interfering speaker, noise, and music are obtained to show the effectiveness of the proposed method. Also several ICA algorithms are used to compare the performances of different ICA methods. As a result of experiments, it has been successfully shown that ICA algorithms, like the EGLD-ICA and Fast-ICA, can be used as a front-end for speaker recognition systems to separate sound mixtures into source signals therefore increase the performance of the recognition task.
Benzer Tezler
- Factors causing time slippages and budget overruns in it projects
Bilgi teknolojileri projelerinde zaman ve bütçe aşımına sebep olan faktörler
ÇİĞDEM ALTIN
Yüksek Lisans
İngilizce
2003
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. FETHİ ÇALIŞIR
- Projelerde zaman ve bütçe aşımına neden olan faktörlerin analizi
Analysis of the factors behind time slippage and budget overruns in project applications
ALİ MÜBDİ TURŞAH
Yüksek Lisans
Türkçe
2002
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiYöneylem Araştırması Ana Bilim Dalı
DOÇ. DR. FETHİ ÇALIŞIR
- Taşıtlarda motor fren momenti karakteristiğinin deneysel olarak bulunması
Başlık çevirisi yok
CENGİZ İRFANOĞLU
Yüksek Lisans
Türkçe
1998
Makine Mühendisliğiİstanbul Teknik ÜniversitesiMakine Mühendisliği Ana Bilim Dalı
PROF. DR. ALİ G. GÖKTAN
- Music retrieval systems: Robust performance under the effect of uncertainty
Başlık çevirisi yok
ERDEM ÜNAL
Doktora
İngilizce
2008
Elektrik ve Elektronik MühendisliğiUniversity of Southern CaliforniaDR. SHRIKANTH NARAYANAN
- Sert latekslerden film oluşumunun faton soğurma yöntemi ile çalışılması
Başlık çevirisi yok
FİGEN KENEROĞLU