Geri Dön

Comparison of text-independent speaker verification systems in a multi-class, semi-automatic detection scenario

Metinden bağımsız konuşmacı doğrulama sistemlerinin çok sınıflı, yarı otomatik bir tanıma senaryosunda karşılaştırılması

  1. Tez No: 335574
  2. Yazar: FATİH YEŞİL
  3. Danışmanlar: YRD. DOÇ. DR. CENK DEMİROĞLU
  4. Tez Türü: Yüksek Lisans
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2013
  8. Dil: İngilizce
  9. Üniversite: Özyeğin Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 77

Özet

Konuşmacı doğrulama sistemlerinin başarısı tipik olarak bu sistemlerin ikili karar vermedeki doğruluguna dayanarak ölçülür. Sistemlerin gerçek değerli çıktıları çoğunlukla sistem kalibrasyonu veya çoklu sistem kombinasyonları gibi amaçlar doğrultusunda kullanılır. Ancak, finans fi rmalarının çagrı merkezleri gibi yerlerde kullanılan ve %100'e yakın kesinlik gerektiren konuşmacı doğrulama uygulamalarında, varolan sistemlerin ikili kararlarına güvenmek mümkün değildir. Yine de bu tür durumlarda, konuşmacı doğrulama sistemi tarafından döndürülen çoklu-sınıf doğrulama çıktıları (örnegin yüksek, orta, düşük doğrulama yüzdesi) çagrı merkezi temsilcisi tarafından, sadece insan olan senaryoya göre doğrulama süresini kısaltmak ve/veya doğrulama kesinliğini arttırmak için kullanılabilir. Bu tezde ilk olarak gerçekleyip kullandığımız algoritmaları detaylı bir şekilde anlatarak bir konuşmacı doğrulama sisteminin genel görünümünü vereceğiz. Bilhassa bir doğrulama amacı için ilk defa bizim kullandığımız, bir sınıflandırıcı olan GDA hakkında detaylı bilgi vereceğiz. GDA bizim ele aldığımız problemdeki gibi doğrusal olmayan verilerin sınıflandırılmasında görece olarak daha iyi çalışıyor. Deneyler bölümünde ise öncelikle bazı çok bilinen konuşmacı doğrulama sistemlerinin başarımlarını klasik başarım ölçütlerini kullanarak karşılaştırdık. Daha sonra, doğrulama döngüsünde bir çagrı merkezi temsilcisinin de olduğunu varsayarak, bu sistemlerin çoklu-sınıf başarımlarını karşılastırdık. Başarım, temsilcinin güvenlikten ödün vermeden sorması  gereken soru miktarındaki azalmaya göre ölçüldü. Deneyler NIST 2006 ve 2008 veritabanları kullanılarak gerçekleştirildi. Herbiri beşer dakikalık olan bir ve sekiz karşılıklı konuşmadan alınan kayıtlar ses imzalarının çıkarımında kullanıldı. Doğrulama yapılacak konuşma içinse beş dakikalık bir ve on saniyelik bir kayıt kullanıldı.

Özet (Çeviri)

Performance of the speaker veri cation systems is typically measured based on their binary decision accuracy. Soft outputs of the systems are used mostly for calibration or multiple system combination purposes. However, in speaker veri cation applications where close to 100% accuracy is required, such as the systems that are used in the call centers of nance companies, it is not possible to rely on the binary decisions of the existing veri cation systems. Still, in such cases, multi-class veri cation outputs (for example, high, medium and low veri cation score) returned by the speaker veri cation systems can be used by a human agent to either reduce the veri cation time and/or increase the veri cation accuracy compared to a human-only scenario. In this thesis, an overview of a speaker veri cation system is given explaining in detail the algorithms that are implemented. Particularly the details about a classi- er, GDA, which was rstly used by us for a veri cation purpose are given. It does relatively better job than state of the art algorithms for non-linear data like in our case. In the experiments section, some of the most popular speaker veri cation systems are compared in terms of the classical performance metric used in the literature. Then, multi-class output performance of them is compared when a human agent is assumed to be in the veri cation loop. Performance is measured by the reduction in the number of questions used by the human agent for verifying the identity of the caller without compromising the security. Experiments are performed using the NIST 2006 and 2008 databases. Eight and one conversation sides (5 minutes each) enrollment data and 1 side and 10 seconds veri cation data conditions are used.

Benzer Tezler

  1. Konuşmacı tanımada map uyarlamalı sınıflandırıcılar

    Map adapted classifiers for speaker recognition

    CEMAL HANİLÇİ

    Doktora

    Türkçe

    Türkçe

    2013

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolUludağ Üniversitesi

    Elektronik Mühendisliği Bölümü

    YRD. DOÇ. FİGEN ERTAŞ

  2. Domain adaptation for speech-driven affective facial features synthesis

    Başlık çevirisi yok

    RIZWAN SADIQ

    Doktora

    İngilizce

    İngilizce

    2020

    Elektrik ve Elektronik MühendisliğiKoç Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    Prof. Dr. ENGİN ERZİN

  3. Küresel fiziksel aktivite anketinin (GPAQ) Türkçeye uyarlanması, güvenilirlik ve geçerliliğinin Bornova Belediyesi çalışanlarında değerlendirilmesi

    Adaptation of the global physical activity questionnaire (GPAQ) to turkish and its reliability and validity among bornova municipality employees

    İLKER ADIGÜZEL

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2017

    Halk SağlığıEge Üniversitesi

    Halk Sağlığı Ana Bilim Dalı

    DOÇ. DR. İSABEL RAİKA DURUSOY ONMUŞ

  4. Cross-lingual voice conversion

    Diller arasında konuşmacı dönüştürme

    OYTUN TÜRK

    Doktora

    İngilizce

    İngilizce

    2007

    Elektrik ve Elektronik MühendisliğiBoğaziçi Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    PROF.DR. LEVENT MUSTAFA ARSLAN

  5. The significance and the contribution of 6+1 traits of writing to the success of the students in writing courses in English language teaching

    Yazmanın 6+1 özelliğinin İngilizce öğretiminde yazılı anlatım derslerindeki öğrenci başarısına katkısı ve önemi

    ÖZLEM YAZAR

    Yüksek Lisans

    İngilizce

    İngilizce

    2004

    Eğitim ve ÖğretimGazi Üniversitesi

    İngiliz Dili Eğitimi Ana Bilim Dalı

    YRD. DOÇ. DR. PAŞA TEVFİK CEPHE