Noise robust speaker recognition under unknown noise environment
Bilinmeyen gürültü çevre ortamında güvenli konuşmacı tanımlama
- Tez No: 390504
- Danışmanlar: DOÇ. DR. ZEKERİYA TÜFEKÇİ
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2015
- Dil: İngilizce
- Üniversite: Çukurova Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 76
Özet
Konuşmacı doğrulama sisteminin performansı ve karalalığı gürültülü ortamlar altında arttırmak için, üzerinde bir çok yaklaşım ve tasarım araştırlmıştır. Eğitim ve test koşulları arasında hiçbir uyumsuzluk olmadığı zaman sistem en yüksek performansta çalışır. Bu nendenle, tüm metodlar arasında Paralel Model Kombinasyonu (PMK), bahsedilen konuyu en uygun ele alan teknik olarak görünmektedir. Bu metod, test ve eğitim koşulları arasında olan uyumsuzluğu, minimize ederek çözmektedir. Bu çalışmanın ana amacı, konuşmacı doğrulama sisteminin performansını arrtırmaktır. Daha önceki çalışmalarda, PMK tekniği, gürültü istatistiğinin bilindiğini varsayarak, gürültüsüz konuşma ve gürültü modelleri kullanılarak, gürültülü konuşma modelinin parametrelerini tahmin etmek için kullanılmıştır. Bu çalışmada gürültünün bilinmediği varsayılmıştır. Ses Aktivite Tespiti (SAT) teknikleri kullanılarak gürültü, gürültülü konuşmadan tahmin edilmiştir. Buna göre, karakterize edilen belirlibilir SAT tekneği konuşma olmayan kısmı, gürültü modelini tahmin etmek için kullanılabilir. Bu çalışmada, doğrudan gürültü sinyalinden gürültü modelini tahmin eden metod, temel metod olarak adlandırılmıştır. Bundan sonra, temel metod performansı SAT tekniklerinin performansı ile karşılaştırılmıştır. Konuşmacı doğrulama sisteminin performansı değerlendirmek için NIST 1998 konuşmacı tanıma ve NOISEX- 92 gürültü veritabanları kullanılmıştır. Deneysel sonuçlar, gürültü modelini tahmin etmek için SAT teknikleri kullanılan metodunun performansı, temel metodunun performansı ile yüksek Sinyal Gürültü Oranları (SGO) için karşılaştırılabilir olduğunu göstermektedir. Fakat, düşük SGO oranlarında temel metod Eşit Hata Oranı (EHO) olarak daha iyi sonuçlar vermiştir.
Özet (Çeviri)
Many approaches designed to increase the performance and stability of the speaker verification system under adverse conditions were studied, performance will be at its peak when no mismatch occurs between training and testing conditions. Therefore, among all these methods, the Parallel Model Combination (PMC) appears to be the most adequate and capable techniques to handle such issue, where it compensates by minimizing the mismatch occurring between the test and the training conditions. In this study the main goal is to increase the performance of the speaker verification system. In previous studies, the (PMC) method was used to estimate the noisy speech parameters by using clean speech and noise model, assuming noise statistics are known. In this study, it is assumed that noise is not known. Noise is estimated using common VAD techniques from the noisy speech. Accordingly non-speech that is characterized by a certain VAD technique can be considered to estimate the noise model. In this study two common VAD techniques are used to to estimate the noise model, and PMC is used to estimate the noisy speech for all methods. The method that estimates the noise model directly from the noise signal is referred to the baseline method.Thereafter, the performance of the baseline is compared with that of the VAD techniques. NIST 1988 speaker recognition databases and NOISEX-92 databases were used to evaluate the performance of the speaker verification system. Expiremental results shows that the performance of the method that used the VAD techniques to estimate the noise model is comparable with the baseline method in the case of high signal-to-noise-ratio (SNR) levels, however in the case of low SNR levels, baseline method yielded better results in terms of equall error rate (EER).
Benzer Tezler
- Design of robust speaker idintification with built-in noise immunity
Gürültü ayırıma özellikli hoparlör tasarımı
ALI NAJDET NASRET CORAN
Doktora
İngilizce
2021
Elektrik ve Elektronik MühendisliğiÇankaya ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. HAYRİ SEVER
DR. ÖĞR. ÜYESİ MURAD MOHAMMED AMIN
- Robust end-to-end synthetic speech detection with deep neural networks and masking
Sağlam sonlu durumlu yapay konuşma algılama: Derin sinir ağları ve maskelerle güçlendirilmiş bütünsel yaklaşım
BARIŞ AYDIN
Yüksek Lisans
İngilizce
2023
Elektrik ve Elektronik MühendisliğiAdana Alparslan Türkeş Bilim Ve Teknoloji ÜniversitesiElektrik ve Elektronik Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ GÖKAY DİŞKEN
- Gürültülü ortamlarda Türkçe ayrık sözcük konuşma tanıma sistemi gerçekleştirimi
Realization of a Turkish isolated word speech recognition system under noisy environments
NEDİM KARACA
Doktora
Türkçe
1999
Elektrik ve Elektronik MühendisliğiHacettepe ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. H. SELÇUK GEÇİM
- Speech recognition based on pattern comparison techniques
Başlık çevirisi yok
OSMAN MERAL
Yüksek Lisans
İngilizce
1996
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiDOÇ.DR. BÜLENT ÖRENCİK
- Örneklem tabanlı gürbüz konuşma tanıma
Exemplar based noise robust speech recognition
FATİH AKTÜRK
Yüksek Lisans
Türkçe
2015
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
DOÇ. DR. ENDER METE EKŞİOĞLU