Geri Dön

Text-independent speaker verification with very short utterances

Çok kısa kayıtlarla metin bağımsız konuşmacı doğrulama

  1. Tez No: 812492
  2. Yazar: İSMAİL RASİM ÜLGEN
  3. Danışmanlar: PROF. DR. MUSTAFA LEVENT ARSLAN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: İngilizce
  9. Üniversite: Boğaziçi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 74

Özet

Konuşma süresi çok kısa olduğunda metin-bağımsız konuşmacı doğrulamanın başarısı büyük ölçüde düşmektedir. Bu tezde, çok kısa ifadelerle konuşmacı do\u{g}rulamadaki ciddi performans düşüşünü telafi etmeyi amaçlayan bazı yöntemler önerilmektedir. İlk olarak, çok kısa konuşma ifadelerinde mevcut olan sınırlı konuşmacı bilgisini geliştirmek için büyük ölçekli konuşmacı veri kümelerinden gelen ek bilgilerden yararlanmaya çalışan yöntemler önerilmektedir. İkinci olarak, kısa konuşma ifadeleri sorunu, konuşmanın fonetik içeriği açısından daha spesifik bir şekilde ele alınmaktadır. Doğrulama ifadeleri arasındaki fonetik uyumsuzluğun bir analizi ve konuşmacı doğrulamasında fonetik uyumsuzluğun farkında olan bir arka uç skorlama modülünün deneyleri gerçekleştirilmiştir. Genel olarak konuşmacı doğrulamasına yönelik, ancak çok kısa süreli koşullara uygulanabilecek katkılar da sunulmuştur. Arka uç puanlama modülü eğitimi için yeni bir kayıp fonksiyonu önerilmiştir. Önerilen kayıp fonksiyonu, çok kısa süreli senaryo da dahil olmak üzere tüm durumlarda referans temel kayıp fonksiyonundan daha iyi performans göstermiştir. Son olarak, konuşmacı doğrulamada kullanılan ayrıştırıcı arka uç skorlarması için yeni bir denetimsiz alan uyarlaması önerilmiştir. Önerilen uyarlama yöntemi, tüm durumlarda alan dışı arka uç puanlama modelinin hedef alandaki performansını iyileştirmiştir. Önerilen yöntemin temel uyarlama yöntemlerine kıyasla göreceli iyileşmesi, kısa süreli koşullarda en yüksektir.

Özet (Çeviri)

The accuracy of the text-independent speaker verification suffers greatly when the speech duration is very short. In this thesis, some methods are proposed aiming to compensate for the drastic performance degradation in speaker verification with very short utterances. Firstly, methods that try to leverage the additional information from large-scale speaker datasets are proposed in order to enhance the limited speaker information that is present in the very short speech utterances. Secondly, the problem of short utterances is tackled in a more specific way in terms of the phonetic content of the speech. An analysis of phonetic mismatch between verification utterances is performed, along with experiments of a back-end scoring module that is aware of the phonetic mismatch in speaker verification. Furthermore, contributions to the speaker verification in general, which might be applicable to the very short duration conditions are presented. A novel loss function for back-end scoring module training is introduced. The proposed loss function outperformed the baseline loss function in all cases, including very short duration scenario. Lastly, a novel unsupervised domain adaptation of the discriminative back-end scoring for speaker verification is proposed. The proposed adaptation method improved the performance of the out-of-domain back-end scoring model in the target domain in all cases. The relative improvement of the proposed method, compared to baseline adaptation methods, is highest in short duration conditions.

Benzer Tezler

  1. Spoofing and anti-spoofing techniques for text-independent speaker verification systems

    Metinden bağımsız konuşmacı doğrulama sistemleri için saldırı ve anti-saldırı teknikleri

    ALİ KHODABAKHSH

    Yüksek Lisans

    İngilizce

    İngilizce

    2015

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÖzyeğin Üniversitesi

    Bilgisayar Bilimleri Ana Bilim Dalı

    PROF. DR. CENK DEMİROĞLU

  2. Text independent speaker verification using neural networks

    Sinir ağları kullanarak metin bağımsız konuşmacı doğrulama

    SEDAT DEMİRBAĞ

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Elektrik ve Elektronik MühendisliğiBoğaziçi Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. MUSTAFA LEVENT ARSLAN

  3. Effects of data duration, model size and session variability on speaker verification performance

    Veri süresi, model büyüklüğü ve oturum değişkenliğinin konuşmacı doğrulama başarımına etkisi

    ERİNÇ DİKİCİ

    Yüksek Lisans

    İngilizce

    İngilizce

    2009

    Elektrik ve Elektronik MühendisliğiBoğaziçi Üniversitesi

    Elektrik ve Elektronik Mühendisliği Bölümü

    YRD. DOÇ. MURAT SARAÇLAR

  4. Konuşmacı tanıma yöntemlerinin karşılaştırmalı analizi

    A comparative study of speaker recognition techniques

    CEMAL HANİLÇİ

    Yüksek Lisans

    Türkçe

    Türkçe

    2007

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolUludağ Üniversitesi

    Elektronik Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. FİGEN ERTAŞ

  5. Voip security in public networks

    Halka açık ağlarda IP üzerinden ses iletiminin güvenliği

    SEYLAN ÇINAR

    Yüksek Lisans

    İngilizce

    İngilizce

    2012

    Elektrik ve Elektronik MühendisliğiDokuz Eylül Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. ÖZGE ŞAHİN