Geri Dön

Local representations and random sampling for speaker verification

Konuşmacı doğrulama için yerel betimlemeler ve rasgele örnekleme

  1. Tez No: 309376
  2. Yazar: YUSUF ZİYA IŞIK
  3. Danışmanlar: YRD. DOÇ. DR. HAKAN ERDOĞAN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2010
  8. Dil: İngilizce
  9. Üniversite: Sabancı Üniversitesi
  10. Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 77

Özet

Son on yılda, metin bağımsız konuşmacı tanıma alanında yapılan calışmalar konuşmacıiçi değişintileri modelleme esnasında giderme üzerine odaklanmıştır. Konuşmacı içideğişintiler kanal etkilerinden, fonetik içerikten, veya konuşma stili, duygusal durum,sağlık ve benzeri sebeplerle konuşmacının kendisinden kaynaklanabilir. Ortak FaktörAnalizi, Toplam Değişkenlik Uzayı, Sıkıntı Öznitelik İzdüşümü literatürde oturumlararası değişkenlikleri gidermede kullanılan yöntemlerin en başarılılarındandır.Bu çalışmada, önerilen metodlardaki kanal uzayının düşük boyutlu olma varsayımınıirdeledik ve akustik uzayı yerel bölgelere ayırmayı önerdik. Konuşmacı içi değişintilerher yerel bölgede bağımsız olarak bastırıldı. İleriki modelleme ve skorlama safhalarınınyerel mi yoksa global mi yapılacağına bağlı olarak iki farklı yapı önerildi.Konuşmacı içi değişintinin elemanlarından biri olan oturum içi değişkenlikler üzerindede çalışıldı. Oturum içi değişkenliklerin ana kaynağı bir ses dosyasının farklı kısımlarıarasındaki fonetik içerik farklılıklarıdır. Fonetik içerik farklılıkları, akustik birimlerarası değişintilerden kaynaklanabileceği gibi aynı akustik birimin farklı çıkarımlarındanda kaynaklanabilir. Bu değişintileri giderme amaçlı olarak, eğitim verisinin rasgeleörneklenmesine dayalı bir metod önerdik. Önerilen metodun hem kısa hem de uzuntest verilerinde etkin olduğu gösterildi.

Özet (Çeviri)

In text-independent speaker verification, studies focused on compensating intra-speakervariabilities at the modeling stage through the last decade. Intra-speaker variabilitiesmay be due to channel effects, phonetic content or the speaker himself in the form ofspeaking style, emotional state, health or other similar factors. Joint Factor Analysis,Total Variability Space compensation, Nuisance Attribute Projection are some of themost successful approaches for inter-session variability compensation in the literature.In this thesis, we criticize the assumptions of low dimensionality of channel space in thesemethods and propose to partition the acoustic space into local regions. Intra-speakervariability compensation may be done in each local space separately. Two architecturesare proposed depending on whether the subsequent modeling and scoring steps will alsobe done locally or globally.We have also focused on a particular component of intra-speaker variability, namelywithin-session variability. The main source of within-session variability is the differencesin the phonetic content of speech segments in a single utterance. The variabilities inphonetic content may be either due to across acoustic event variabilities or due to differencesin the actual realizations of the acoustic events. We propose a method to combatthese variabilities through random sampling of training utterance. The method is shownto be effective both in short and long test utterances.

Benzer Tezler

  1. Stochastic roadmap simulation: An efficient representation and algorithm for analyzing molecular motion

    Stokastik yol haritasi simulasyonu: Molekuler hareket analizi icin verimli bir temsil ve algoritma

    MEHMET SERKAN APAYDIN

    Doktora

    İngilizce

    İngilizce

    2004

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolStanford University

    Mühendislik ve Doğa Bilimleri Ana Bilim Dalı

    PROF. DR. JEAN-CLAUDE LATOMBE

  2. Bulanık çok modlu kaynak kısıtlı proje çizelgeleme problemlerinin çözümü için matematiksel bir model

    A mathematical model for the solution of the fuzzy multi mode resource-constrained project scheduling problems

    ÖMER ATLI

    Doktora

    Türkçe

    Türkçe

    2012

    Endüstri ve Endüstri MühendisliğiHava Harp Okulu Komutanlığı

    Endüstri Mühendisliği Ana Bilim Dalı

    PROF. DR. CENGİZ KAHRAMAN

  3. 6360 sayılı kanunun halkın belediye algısı üzerindeki etkisi: Maçka örneği

    The effect of law no. 6360 on people's perception of municipality: The case of Maçka

    BATUHAN AYDIN

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Kamu YönetimiKaradeniz Teknik Üniversitesi

    Kamu Yönetimi Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ EMRAH FİRİDİN

  4. Factors affecting women participation into politics of Somalia

    Kadınların Somali siyasetine katılımını etkileyen faktörler

    FADUMO SAİD MOHAMED

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Siyasal Bilimlerİstanbul Gedik Üniversitesi

    İşletme Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ Selim Sezer

  5. Markov ve Gibbs rastlantı alan modelleri ile doku sentezleme ve sınıflandırma

    Texture synthesis and classification using Markov and Gibbs random field models

    ERDOĞAN CAMCIOĞLU

    Yüksek Lisans

    Türkçe

    Türkçe

    1990

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    PROF. DR. ERDAL PANAYIRCI