Geri Dön

Blind audio source separation using independent component analysis and independent vector analysis methods

Bağımsız bileşen analizi ve bağımsız vektör analizi kullarak ses sinyallerinde kör kaynak ayrıştırımı

  1. Tez No: 467755
  2. Yazar: ALYAA ABDULHUSSEIN MAHDI ALRWSTIM
  3. Danışmanlar: Prof. Dr. NİZAMETTİN AYDIN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Kör Kaynak Ayrıştırma, Bağımsız Bileşen Analizi, bağımsız vektör analizi, Çekirdek Bağımsız Bileşen Analizi, Blind source separation, Independent component analysis, Independent vector analysis, kernel Independent component analysis
  7. Yıl: 2017
  8. Dil: İngilizce
  9. Üniversite: Yıldız Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 63

Özet

Kör kaynak ayrıştırma (KKA) ses ve konuşma işleme alanındaki önemli problemlerden birisidir. Bu problemi çözmek için literatürde farklı yöntemler önerilmiştir. Buna ek olarak konuşmacı tanıma da araştırmacılar için onyıllarca üzerinde çalışmaların yapıldığı bir çalışma alanıdır. Bu çalışmada kör kaynak ayrıştırma problemini çözmek için kullanılan Bağımsız bileşen analizi (BBA) ve bağımsız vektör analizi (BVA) yöntemlerinin uygulamaları olan Hızlı – BBA, Çekirdek - BBA ve Hızlı – BVA algoritmaları üzerinde karşılaştırmalar yapılmıştır. İlk olarak Source-to-Artifact oranı, Source-to- Distortion oranı, Source-to-Noise oranı karşılaştırma yapmak için uygulanmıştır. Daha sonraki araştırmalar için konuşmacı tanıma sistemi kaynak ayrıştırma işlemlerinin konuşmacı tanıma etkisini incelemek maksadıyla oluşturulmuştur. Çalışmada 10 kadından ve 12 erkekten oluşan 22 konuşmacıdan elde edilen ELSDSR veri seti kullanılmıştır. KKA sisteminin performansı dört farklı senaryo ile test edilmiştir. Bunlardan ilk üç tanesi gürültünün sisteme etkisini görmek için yapılmıştır. Dolayısıyla bunu yapmak için gürültü içermeyen karıştırılmış sinyaller, karıştırılmış sinyallere Gauss gürültüsü eklenmiş yeni sinyal ve gürültü içermeyen sinyallere Gauss gürültüsü eklenmiş sinyaller kullanılmıştır. Çalışmadaki dördüncü senaryo ise konuşmacı tanıma sisteminin Gauss Karışım modeli ve Ivector yöntemlerinin konuşmacı tanıma sistemi performanslarının sıklıkla kullanılan Eşit Hata Oranı (EHO) ile karşılaştırılmasını içermektedir. Deneysel sonuçlar; EHO ölçütüne göre Hızlı-BVA algoritmasının Hızlı- BBA algoritmasının daha başarılı olduğunu göstermektedir. Ayrıca EHO ölçütü açısından BVA ve BBA tarafından ayrılan sinyallerin I-Vektör yönteminin Gauss Karışım Modelinden daha başarılı sonuçlar vermiştir.

Özet (Çeviri)

Blind Source Separation (BSS) is one of the most challenging problems in the field of audio and speech processing. Many different methods have been proposed to solve BSS problem in the literature. In addition, speaker recognition systems have gained considerable interest from researchers for decades due to the breadth of their field of application. In this study, we have compared the performance of three popular BSS methods implementations: Fast-ICA, Kernel-ICA and Fast-IVA which are based on Independent Component analysis (ICA) and Independent Vector Analysis (IVA) respectively. Initially, classical performance comparison metrics such as Source-to-Artifact Ratio, Source-to- Distortion Ratio, Source-to-Noise Ratio, are implemented for comparison. For further investigation, speaker recognition system has been developed to examine the effect of speech separation on the performance of these recognition systems. In our experiments, we used two data set the first one is in Arabic languge and contains voice records frome 13 speaker: 3 female , 10 male.the second data set is the ELSDSR data which in English languge and contains voice records from 22 speakers: 10 female, 12 male. The performance of BSS methods is measured under four scenarios. The first three is composed to see the effect of noise. Therefore, we used the mixture of clean source signals, the mixture of source signals with additive Gaussian noise, adding Gaussian noise to clean source mixture. In the fourth scenario, we applied speaker recognition system based on Gaussian mixture models (GMMs) and I-vectors, the performance of the speaker recognition system is measured by Equal Error Ratio (EER), which is, the most reliable measurement in this field. Experimental results show that the Fast-IVA has better performance than the Fast-ICA method according to performance metrics used in this study. In terms of EER, I-vector gives the better result than GMM for separated signals by IVA and ICA.

Benzer Tezler

  1. Blind audio source separation using nonnegative tensor factorization techniques

    Negatif olmayan tensör faktörizasyonu kullanılarak gözü kapalı ses kaynak ayrıştırma

    MEHMET ALTUĞ KEYDER

    Yüksek Lisans

    İngilizce

    İngilizce

    2008

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    PROF. DR. BİLGE GÜNSEL

  2. Examination of independent component analysis in audio source separation

    Ses kaynak ayrıştırmasında bağımsız bileşen analizi yönteminin incelenmesi

    ELİF EZGİ GÜLER

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Elektrik ve Elektronik MühendisliğiAtılım Üniversitesi

    Elektrik ve Elektronik Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ İBRAHİM BARAN USLU

  3. Perceptual audio source separation by subspace learning

    Altuzay öğrenme ile algısal ses kaynak ayrıştırma

    SERAP KIRBIZ

    Doktora

    İngilizce

    İngilizce

    2013

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    PROF. DR. BİLGE GÜNSEL

  4. Time-domain blind source separation for convolutive mixtures using second-order statistics

    Evrişimsel karışımlar için zaman alanında ikinci dereceden istatistiklerle gözü kapalı kaynak ayrıştırma

    CEMİL DEMİR

    Yüksek Lisans

    İngilizce

    İngilizce

    2007

    Elektrik ve Elektronik MühendisliğiBoğaziçi Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    Y.DOÇ.DR. KEREM HARMANCI

  5. Karışık işitsel ve görsel sinyallerin kör kaynak ayrıştırma yöntemiyle birbirlerinden ayrılması

    Blind source seperation of mixed visual and audio signals

    PELİN GÜVEN

    Yüksek Lisans

    Türkçe

    Türkçe

    2005

    Elektrik ve Elektronik MühendisliğiAnadolu Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. EMİN GERMEN