Text-independent speaker verification with very short utterances
Çok kısa kayıtlarla metin bağımsız konuşmacı doğrulama
- Tez No: 812492
- Danışmanlar: PROF. DR. MUSTAFA LEVENT ARSLAN
- Tez Türü: Yüksek Lisans
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: İngilizce
- Üniversite: Boğaziçi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 74
Özet
Konuşma süresi çok kısa olduğunda metin-bağımsız konuşmacı doğrulamanın başarısı büyük ölçüde düşmektedir. Bu tezde, çok kısa ifadelerle konuşmacı do\u{g}rulamadaki ciddi performans düşüşünü telafi etmeyi amaçlayan bazı yöntemler önerilmektedir. İlk olarak, çok kısa konuşma ifadelerinde mevcut olan sınırlı konuşmacı bilgisini geliştirmek için büyük ölçekli konuşmacı veri kümelerinden gelen ek bilgilerden yararlanmaya çalışan yöntemler önerilmektedir. İkinci olarak, kısa konuşma ifadeleri sorunu, konuşmanın fonetik içeriği açısından daha spesifik bir şekilde ele alınmaktadır. Doğrulama ifadeleri arasındaki fonetik uyumsuzluğun bir analizi ve konuşmacı doğrulamasında fonetik uyumsuzluğun farkında olan bir arka uç skorlama modülünün deneyleri gerçekleştirilmiştir. Genel olarak konuşmacı doğrulamasına yönelik, ancak çok kısa süreli koşullara uygulanabilecek katkılar da sunulmuştur. Arka uç puanlama modülü eğitimi için yeni bir kayıp fonksiyonu önerilmiştir. Önerilen kayıp fonksiyonu, çok kısa süreli senaryo da dahil olmak üzere tüm durumlarda referans temel kayıp fonksiyonundan daha iyi performans göstermiştir. Son olarak, konuşmacı doğrulamada kullanılan ayrıştırıcı arka uç skorlarması için yeni bir denetimsiz alan uyarlaması önerilmiştir. Önerilen uyarlama yöntemi, tüm durumlarda alan dışı arka uç puanlama modelinin hedef alandaki performansını iyileştirmiştir. Önerilen yöntemin temel uyarlama yöntemlerine kıyasla göreceli iyileşmesi, kısa süreli koşullarda en yüksektir.
Özet (Çeviri)
The accuracy of the text-independent speaker verification suffers greatly when the speech duration is very short. In this thesis, some methods are proposed aiming to compensate for the drastic performance degradation in speaker verification with very short utterances. Firstly, methods that try to leverage the additional information from large-scale speaker datasets are proposed in order to enhance the limited speaker information that is present in the very short speech utterances. Secondly, the problem of short utterances is tackled in a more specific way in terms of the phonetic content of the speech. An analysis of phonetic mismatch between verification utterances is performed, along with experiments of a back-end scoring module that is aware of the phonetic mismatch in speaker verification. Furthermore, contributions to the speaker verification in general, which might be applicable to the very short duration conditions are presented. A novel loss function for back-end scoring module training is introduced. The proposed loss function outperformed the baseline loss function in all cases, including very short duration scenario. Lastly, a novel unsupervised domain adaptation of the discriminative back-end scoring for speaker verification is proposed. The proposed adaptation method improved the performance of the out-of-domain back-end scoring model in the target domain in all cases. The relative improvement of the proposed method, compared to baseline adaptation methods, is highest in short duration conditions.
Benzer Tezler
- Spoofing and anti-spoofing techniques for text-independent speaker verification systems
Metinden bağımsız konuşmacı doğrulama sistemleri için saldırı ve anti-saldırı teknikleri
ALİ KHODABAKHSH
Yüksek Lisans
İngilizce
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÖzyeğin ÜniversitesiBilgisayar Bilimleri Ana Bilim Dalı
PROF. DR. CENK DEMİROĞLU
- Text independent speaker verification using neural networks
Sinir ağları kullanarak metin bağımsız konuşmacı doğrulama
SEDAT DEMİRBAĞ
Yüksek Lisans
İngilizce
2019
Elektrik ve Elektronik MühendisliğiBoğaziçi ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. MUSTAFA LEVENT ARSLAN
- Effects of data duration, model size and session variability on speaker verification performance
Veri süresi, model büyüklüğü ve oturum değişkenliğinin konuşmacı doğrulama başarımına etkisi
ERİNÇ DİKİCİ
Yüksek Lisans
İngilizce
2009
Elektrik ve Elektronik MühendisliğiBoğaziçi ÜniversitesiElektrik ve Elektronik Mühendisliği Bölümü
YRD. DOÇ. MURAT SARAÇLAR
- Konuşmacı tanıma yöntemlerinin karşılaştırmalı analizi
A comparative study of speaker recognition techniques
CEMAL HANİLÇİ
Yüksek Lisans
Türkçe
2007
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolUludağ ÜniversitesiElektronik Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. FİGEN ERTAŞ
- Voip security in public networks
Halka açık ağlarda IP üzerinden ses iletiminin güvenliği
SEYLAN ÇINAR
Yüksek Lisans
İngilizce
2012
Elektrik ve Elektronik MühendisliğiDokuz Eylül ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
YRD. DOÇ. ÖZGE ŞAHİN