Geri Dön

Noise robust speaker recognition under unknown noise environment

Bilinmeyen gürültü çevre ortamında güvenli konuşmacı tanımlama

  1. Tez No: 390504
  2. Yazar: MOHAMAD DIA ABDULKARİM
  3. Danışmanlar: DOÇ. DR. ZEKERİYA TÜFEKÇİ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2015
  8. Dil: İngilizce
  9. Üniversite: Çukurova Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 76

Özet

Konuşmacı doğrulama sisteminin performansı ve karalalığı gürültülü ortamlar altında arttırmak için, üzerinde bir çok yaklaşım ve tasarım araştırlmıştır. Eğitim ve test koşulları arasında hiçbir uyumsuzluk olmadığı zaman sistem en yüksek performansta çalışır. Bu nendenle, tüm metodlar arasında Paralel Model Kombinasyonu (PMK), bahsedilen konuyu en uygun ele alan teknik olarak görünmektedir. Bu metod, test ve eğitim koşulları arasında olan uyumsuzluğu, minimize ederek çözmektedir. Bu çalışmanın ana amacı, konuşmacı doğrulama sisteminin performansını arrtırmaktır. Daha önceki çalışmalarda, PMK tekniği, gürültü istatistiğinin bilindiğini varsayarak, gürültüsüz konuşma ve gürültü modelleri kullanılarak, gürültülü konuşma modelinin parametrelerini tahmin etmek için kullanılmıştır. Bu çalışmada gürültünün bilinmediği varsayılmıştır. Ses Aktivite Tespiti (SAT) teknikleri kullanılarak gürültü, gürültülü konuşmadan tahmin edilmiştir. Buna göre, karakterize edilen belirlibilir SAT tekneği konuşma olmayan kısmı, gürültü modelini tahmin etmek için kullanılabilir. Bu çalışmada, doğrudan gürültü sinyalinden gürültü modelini tahmin eden metod, temel metod olarak adlandırılmıştır. Bundan sonra, temel metod performansı SAT tekniklerinin performansı ile karşılaştırılmıştır. Konuşmacı doğrulama sisteminin performansı değerlendirmek için NIST 1998 konuşmacı tanıma ve NOISEX- 92 gürültü veritabanları kullanılmıştır. Deneysel sonuçlar, gürültü modelini tahmin etmek için SAT teknikleri kullanılan metodunun performansı, temel metodunun performansı ile yüksek Sinyal Gürültü Oranları (SGO) için karşılaştırılabilir olduğunu göstermektedir. Fakat, düşük SGO oranlarında temel metod Eşit Hata Oranı (EHO) olarak daha iyi sonuçlar vermiştir.

Özet (Çeviri)

Many approaches designed to increase the performance and stability of the speaker verification system under adverse conditions were studied, performance will be at its peak when no mismatch occurs between training and testing conditions. Therefore, among all these methods, the Parallel Model Combination (PMC) appears to be the most adequate and capable techniques to handle such issue, where it compensates by minimizing the mismatch occurring between the test and the training conditions. In this study the main goal is to increase the performance of the speaker verification system. In previous studies, the (PMC) method was used to estimate the noisy speech parameters by using clean speech and noise model, assuming noise statistics are known. In this study, it is assumed that noise is not known. Noise is estimated using common VAD techniques from the noisy speech. Accordingly non-speech that is characterized by a certain VAD technique can be considered to estimate the noise model. In this study two common VAD techniques are used to to estimate the noise model, and PMC is used to estimate the noisy speech for all methods. The method that estimates the noise model directly from the noise signal is referred to the baseline method.Thereafter, the performance of the baseline is compared with that of the VAD techniques. NIST 1988 speaker recognition databases and NOISEX-92 databases were used to evaluate the performance of the speaker verification system. Expiremental results shows that the performance of the method that used the VAD techniques to estimate the noise model is comparable with the baseline method in the case of high signal-to-noise-ratio (SNR) levels, however in the case of low SNR levels, baseline method yielded better results in terms of equall error rate (EER).

Benzer Tezler

  1. Design of robust speaker idintification with built-in noise immunity

    Gürültü ayırıma özellikli hoparlör tasarımı

    ALI NAJDET NASRET CORAN

    Doktora

    İngilizce

    İngilizce

    2021

    Elektrik ve Elektronik MühendisliğiÇankaya Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    PROF. DR. HAYRİ SEVER

    DR. ÖĞR. ÜYESİ MURAD MOHAMMED AMIN

  2. Robust end-to-end synthetic speech detection with deep neural networks and masking

    Sağlam sonlu durumlu yapay konuşma algılama: Derin sinir ağları ve maskelerle güçlendirilmiş bütünsel yaklaşım

    BARIŞ AYDIN

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Elektrik ve Elektronik MühendisliğiAdana Alparslan Türkeş Bilim Ve Teknoloji Üniversitesi

    Elektrik ve Elektronik Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ GÖKAY DİŞKEN

  3. Gürültülü ortamlarda Türkçe ayrık sözcük konuşma tanıma sistemi gerçekleştirimi

    Realization of a Turkish isolated word speech recognition system under noisy environments

    NEDİM KARACA

    Doktora

    Türkçe

    Türkçe

    1999

    Elektrik ve Elektronik MühendisliğiHacettepe Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. H. SELÇUK GEÇİM

  4. Örneklem tabanlı gürbüz konuşma tanıma

    Exemplar based noise robust speech recognition

    FATİH AKTÜRK

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ENDER METE EKŞİOĞLU