Blind audio source separation using independent component analysis and independent vector analysis methods
Bağımsız bileşen analizi ve bağımsız vektör analizi kullarak ses sinyallerinde kör kaynak ayrıştırımı
- Tez No: 467755
- Danışmanlar: Prof. Dr. NİZAMETTİN AYDIN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Kör Kaynak Ayrıştırma, Bağımsız Bileşen Analizi, bağımsız vektör analizi, Çekirdek Bağımsız Bileşen Analizi, Blind source separation, Independent component analysis, Independent vector analysis, kernel Independent component analysis
- Yıl: 2017
- Dil: İngilizce
- Üniversite: Yıldız Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
- Sayfa Sayısı: 63
Özet
Kör kaynak ayrıştırma (KKA) ses ve konuşma işleme alanındaki önemli problemlerden birisidir. Bu problemi çözmek için literatürde farklı yöntemler önerilmiştir. Buna ek olarak konuşmacı tanıma da araştırmacılar için onyıllarca üzerinde çalışmaların yapıldığı bir çalışma alanıdır. Bu çalışmada kör kaynak ayrıştırma problemini çözmek için kullanılan Bağımsız bileşen analizi (BBA) ve bağımsız vektör analizi (BVA) yöntemlerinin uygulamaları olan Hızlı – BBA, Çekirdek - BBA ve Hızlı – BVA algoritmaları üzerinde karşılaştırmalar yapılmıştır. İlk olarak Source-to-Artifact oranı, Source-to- Distortion oranı, Source-to-Noise oranı karşılaştırma yapmak için uygulanmıştır. Daha sonraki araştırmalar için konuşmacı tanıma sistemi kaynak ayrıştırma işlemlerinin konuşmacı tanıma etkisini incelemek maksadıyla oluşturulmuştur. Çalışmada 10 kadından ve 12 erkekten oluşan 22 konuşmacıdan elde edilen ELSDSR veri seti kullanılmıştır. KKA sisteminin performansı dört farklı senaryo ile test edilmiştir. Bunlardan ilk üç tanesi gürültünün sisteme etkisini görmek için yapılmıştır. Dolayısıyla bunu yapmak için gürültü içermeyen karıştırılmış sinyaller, karıştırılmış sinyallere Gauss gürültüsü eklenmiş yeni sinyal ve gürültü içermeyen sinyallere Gauss gürültüsü eklenmiş sinyaller kullanılmıştır. Çalışmadaki dördüncü senaryo ise konuşmacı tanıma sisteminin Gauss Karışım modeli ve Ivector yöntemlerinin konuşmacı tanıma sistemi performanslarının sıklıkla kullanılan Eşit Hata Oranı (EHO) ile karşılaştırılmasını içermektedir. Deneysel sonuçlar; EHO ölçütüne göre Hızlı-BVA algoritmasının Hızlı- BBA algoritmasının daha başarılı olduğunu göstermektedir. Ayrıca EHO ölçütü açısından BVA ve BBA tarafından ayrılan sinyallerin I-Vektör yönteminin Gauss Karışım Modelinden daha başarılı sonuçlar vermiştir.
Özet (Çeviri)
Blind Source Separation (BSS) is one of the most challenging problems in the field of audio and speech processing. Many different methods have been proposed to solve BSS problem in the literature. In addition, speaker recognition systems have gained considerable interest from researchers for decades due to the breadth of their field of application. In this study, we have compared the performance of three popular BSS methods implementations: Fast-ICA, Kernel-ICA and Fast-IVA which are based on Independent Component analysis (ICA) and Independent Vector Analysis (IVA) respectively. Initially, classical performance comparison metrics such as Source-to-Artifact Ratio, Source-to- Distortion Ratio, Source-to-Noise Ratio, are implemented for comparison. For further investigation, speaker recognition system has been developed to examine the effect of speech separation on the performance of these recognition systems. In our experiments, we used two data set the first one is in Arabic languge and contains voice records frome 13 speaker: 3 female , 10 male.the second data set is the ELSDSR data which in English languge and contains voice records from 22 speakers: 10 female, 12 male. The performance of BSS methods is measured under four scenarios. The first three is composed to see the effect of noise. Therefore, we used the mixture of clean source signals, the mixture of source signals with additive Gaussian noise, adding Gaussian noise to clean source mixture. In the fourth scenario, we applied speaker recognition system based on Gaussian mixture models (GMMs) and I-vectors, the performance of the speaker recognition system is measured by Equal Error Ratio (EER), which is, the most reliable measurement in this field. Experimental results show that the Fast-IVA has better performance than the Fast-ICA method according to performance metrics used in this study. In terms of EER, I-vector gives the better result than GMM for separated signals by IVA and ICA.
Benzer Tezler
- Blind audio source separation using nonnegative tensor factorization techniques
Negatif olmayan tensör faktörizasyonu kullanılarak gözü kapalı ses kaynak ayrıştırma
MEHMET ALTUĞ KEYDER
Yüksek Lisans
İngilizce
2008
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. BİLGE GÜNSEL
- Examination of independent component analysis in audio source separation
Ses kaynak ayrıştırmasında bağımsız bileşen analizi yönteminin incelenmesi
ELİF EZGİ GÜLER
Yüksek Lisans
İngilizce
2022
Elektrik ve Elektronik MühendisliğiAtılım ÜniversitesiElektrik ve Elektronik Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ İBRAHİM BARAN USLU
- Perceptual audio source separation by subspace learning
Altuzay öğrenme ile algısal ses kaynak ayrıştırma
SERAP KIRBIZ
Doktora
İngilizce
2013
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. BİLGE GÜNSEL
- Time-domain blind source separation for convolutive mixtures using second-order statistics
Evrişimsel karışımlar için zaman alanında ikinci dereceden istatistiklerle gözü kapalı kaynak ayrıştırma
CEMİL DEMİR
Yüksek Lisans
İngilizce
2007
Elektrik ve Elektronik MühendisliğiBoğaziçi ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
Y.DOÇ.DR. KEREM HARMANCI
- Karışık işitsel ve görsel sinyallerin kör kaynak ayrıştırma yöntemiyle birbirlerinden ayrılması
Blind source seperation of mixed visual and audio signals
PELİN GÜVEN
Yüksek Lisans
Türkçe
2005
Elektrik ve Elektronik MühendisliğiAnadolu ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. EMİN GERMEN