Geri Dön

Effects of data duration, model size and session variability on speaker verification performance

Veri süresi, model büyüklüğü ve oturum değişkenliğinin konuşmacı doğrulama başarımına etkisi

  1. Tez No: 246031
  2. Yazar: ERİNÇ DİKİCİ
  3. Danışmanlar: YRD. DOÇ. MURAT SARAÇLAR
  4. Tez Türü: Yüksek Lisans
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2009
  8. Dil: İngilizce
  9. Üniversite: Boğaziçi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik ve Elektronik Mühendisliği Bölümü
  12. Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
  13. Sayfa Sayısı: 87

Özet

Konuşmacı doğrulama, biyometrik kimlik denetiminin en zorlayıcı dallarından biridir. Güvenlik sistemlerinden yasal yürütüme kadar geniş bir yelpazede değerlendirilen konuşmacı doğrulama yöntemleri; telefon bankacılığı, adli ses çözümleme ve erişim kontrolü gibi alanlarda kullanılmaktadır. Bu uygulamalarda doğrulama başarımının veri miktarına önemli ölçüde bağlı olduğu ve ses kayıtlarındaki akustik değişimlerden kolayca etkilenebildiği gözlenmiştir. Bu çalışmada veri süresinin, model büyüklüğünün ve oturumlar arası değişkenliğin metinden bağımsız konuşmacı doğrulama başarımına etkisi incelenmektedir.Konuşmacı karakteristiğini tanımlamada Gauss Karışım Modeli/Genel Arkaplan Modeli (GKM/GAM) ve buradan elde edilen süpervektörler ile oluşturulan Destek Vektör Makinaları (DVM) kullanılmış, değişken eğitim ve sınama uzunluklarına ve model karmaşıklıklarına göre sonuçlar karşılaştırılmıştır. Konuşmacı uyarlama yöntemlerinin ve çekirdek fonksiyonu seçiminin doğrulama başarımı üzerindeki etkisi araştırılmıştır. DVM'deki sınıf dengesizliğini gidermek için bir azınlık üst örnekleme yaklaşımı değerlendirilmiştir. Eğitim ve sınama örnekleri arasındaki uyumsuzluktan kaynaklanan oturumlar arası değişkenliğin hata oranlarını artırmasını önlemek amacıyla Sıkıntı Öznitelik İzdüşümü yöntemine başvurulmuştur. CSLU Konuşmacı Doğrulama Veri Kümesi üzerinde, gerek sınırlı gerekse kapsamlı veri durumları için konuşmacı doğrulama sistemlerinin karşılaştırılmalı değerlendirmesi sunulmaktadır.

Özet (Çeviri)

Speaker verification is one of the most challenging branches of biometric authentication. Covering a wide spectrum from security services to law enforcement, speaker verification systems are employed in phone banking, forensic audio analysis and access control applications. An important observation is that verification accuracies depend vastly on the amount of data and get easily affected by acoustic variations. This study investigates the effects of data duration, model size and session variability on text-independent speaker verification performance.We implement GMM/UBM and SVM supervector classifiers to represent speaker characteristics and compare their results for various training and testing durations as well as model complexities. The influence of speaker adaptation methods and kernel function selection over the verification accuracy is examined. A minority oversampling scheme is utilized in order to avoid the issue of class imbalance in SVMs. We also explore how session variability acts on error rates and resort to Nuisance Attribute Projection method for reducing acoustic mismatches between the training and test samples. Working on the CSLU Speaker Recognition Dataset, we present a comparative evaluation of speaker verification systems with limited and extensive data conditions.

Benzer Tezler

  1. Perma çok boyutlu iyi oluş modeline dayalı psiko-eğitim programının yaşamı sürdürme nedenleri, intihar olasılığı ve iyi oluş üzerine etkisi

    The effect of a psychoeducational program based on perma well-being model on reasons for living, suicide probability, and well-being

    AYTEN BÖLÜKBAŞI UYGUR

    Doktora

    Türkçe

    Türkçe

    2023

    Eğitim ve ÖğretimÇukurova Üniversitesi

    Eğitim Bilimleri Ana Bilim Dalı

    PROF. DR. FULYA CENKSEVEN ÖNDER

  2. Yeni bir hata değişik delta ağ maddeli arttırılmış delta ağı (ADA)

    Başlık çevirisi yok

    M.EBRU KOLUSAYIN

    Yüksek Lisans

    Türkçe

    Türkçe

    1998

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Kontrol ve Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. MEHMET BÜLENT ÖRENCİK

  3. Yapılandırmacı öğrenme yaklaşımı ve aktif öğrenmenin çevre eğitimi üzerindeki etkisinin sistematik incelenmesi ve meta-analizi

    Systematic review and meta-analysis of the effectiveness of constructivist learning approach and active learning on environmental education

    SELÇUK ARIK

    Doktora

    Türkçe

    Türkçe

    2017

    Eğitim ve ÖğretimGazi Üniversitesi

    Matematik ve Fen Bilimleri Eğitimi Ana Bilim Dalı

    PROF. DR. MEHMET YILMAZ

  4. Türkiye'deki geleneksel ahşap çerçeve sistem konut yapılarında dış duvarların ısıl ve nemsel performansının değerlendirilmesi

    Hygrothermal performance assessment of exterior walls of traditional timber framed houses in Türkiye

    SEDA NUR ALKAN

    Doktora

    Türkçe

    Türkçe

    2023

    Mimarlıkİstanbul Teknik Üniversitesi

    Mimarlık Ana Bilim Dalı

    DOÇ. DR. FATİH YAZICIOĞLU

  5. Nöro linguistik programlama destekli bireysel ses eğitiminin öğrencilerin performansları üzerindeki etkileri

    Effects of individual voice training supported by neuro linguistic programming on the performance of students

    TUBA KILIÇ

    Doktora

    Türkçe

    Türkçe

    2010

    Eğitim ve ÖğretimGazi Üniversitesi

    Güzel Sanatlar Ana Bilim Dalı

    PROF. DR. AYŞE MERAL TÖREYİN