Improving the performance of speaker identification systems by classifier combination techniques
Konuşmacı tanıma sistemlerinin başarımının sınıflandırıcı birleştirme yöntemleri ile iyileştirilmesi
- Tez No: 93258
- Danışmanlar: Belirtilmemiş.
- Tez Türü: Doktora
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Çoğul Smıflandırıcılı Sistemler, Doğrusal ve Logaritmik Fikir Havuzu, Ağırlık Kestirimi, içerik Bilgisi, Dempster-Shafer Yöntemi, Tamam layıcılık, İstatistiksel Örüntü Tanıma, Konuşmacı Tanıma vıı tCYÜKSEKÖĞRiTtMKüRÜLO MX&MAXIASrm Mnacni, Multiple Classifier Systems, Linear and Logarithmic Opinion Pool, ivWeight Estimation, Contextual Information, Model Clustering, Dempster-Shafer Formalism, Complementariness, Statistical Pattern Recognition, Speaker Identi fication
- Yıl: 2000
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 127
Özet
oz KONUŞMACI TANIMA SİSTEMLERİNİN BAŞARIMININ SINIFLANDIRICI BİRLEŞTİRME YÖNTEMLERİ İLE İYİLEŞTİRİLMESİ Altınçay, Hakan Doktora, Elektrik ve Elektronik Mühendisliği Bölümü Tez Yöneticisi: Prof. Dr. Mübeccel Demirekler Haziran 2000, 111 sayfa Bu çalışmada, konuşmacı tanıma problemi ele alınmıştır ve bu amaçla çoğul sınıflandırıcılı sistemler üzerinde çalışılmıştır. Birbirine tamamlayıcı bilgi sağlayan smıflandırıcıların seçilmesi için bir yöntem geliştirilmiştir. Geliştirilen bu yöntem kullanılarak, sınırlandırıcı birleştirme işleminde kullanılmak üzere iki sınıflan dinci belirlenmiştir. Yapılan çalışma iki bölümden oluşmaktadır. Birinci bölümde, sınıflandın cı sis temleri ile iletişim sistemleri arasında kurulan ilişki anlatılmıştır. Smıflandırıcı sis temlerine bu açıdan bakılarak, çoğul sınıflandırıcılı sistemler geliştirmek amacı ile bilişim kuramında bulunan bazı temel kavramlar kullanılarak smıflandırıcıların vidoğrusal ve logaritmik olarak birleştirilmesi sırasında kullanılmak üzere bir ağırlık kestirim yöntemi geliştirilmiştir. Bu ağırlıklar, sınıflandırıcılarm sınıfa bağımlı ve sınıftan bağımsız güvenilirlikleri hakkında bilgi içermektedir. Smıflandıncılar arasındaki karar oybirliği için de bir ölçek geliştirilmiştir ve bu ölçek ağırlıkların bir çarpanı olarak kullanılmıştır. Kapalı küme konuşmacı tanıma problemi için elde edilen deneysel sonuçlar, hesaplanan ağırlıkların doğrusal ve logaritmik birleş tirme yöntemlerinin tanıma oranını artırdığını göstermektedir. ikinci bölümde, farklı bir sıralama tabanlı sınıflandıncı birleştirme yöntemi üzerinde çalışılmıştır. Bu yöntemde, belirsiz bilgiyi gösterme ve işleme için uygun bir yaklaşım olan Dempster-Shafer teorisi kullanılmıştır. Bu yöntem sıralama istatistiklerine dayanmaktadır. Bu istatistikler kullanılarak farklı sıralar için karışım matrisleri tanımlanmıştır. Karışım matrisleri kullanılarak, konuşmacılar ortak özelliklere sahip konuşmacı kümelerine ayrılmıştır. Bu kümelerin bazıları sı- nıflandırıcmın zayıf veya güçlü yönlerini göstermekte, bazıları da konuşmacıya bağlı sıralama istatistikleri içermektedir. Birden fazla smıflandırıcıya ait kümeler kullanılarak ortak bir karara ulaşılmaktadır. Sınıflandıncı birleştirimi için, son aşamada Dempster birleştirme kuralının uygulandığı kurala dayalı bir algoritma geliştirilmiştir. Bu yöntemle, diğer sıralama tabanlı birleştirme yöntemlerine göre daha iyi sonuçlar elde edilmiştir.
Özet (Çeviri)
ABSTRACT IMPROVING THE PERFORMANCE OF SPEAKER IDENTIFICATION SYSTEMS BY CLASSIFIER COMBINATION TECHNIQUES Altmçay, Hakan Ph.D., Department of Electrical and Electronics Engineering Supervisor: Prof. Dr. Mübeccel Demirekler June 2000, 111 pages In this thesis, speaker identification problem is addressed and the use of multiple classifier systems for this purpose is studied. A method of selecting the classifiers which provide complementary information for the combination operation is proposed. Using this method, two classifiers are selected to be used in the combination operation. The study can be considered in two parts. In the first part, we describe a relation between classification systems and information transmission systems. By looking at the classification systems from this perspective, we propose a method of classifier weight estimation for the linear and logarithmic opinion pool type inclassifier combination schemes for which some tools from information theory are used. These weights provide contextual information about the classifiers such as class dependent classifier reliability and global classifier reliability. A measure for decision consensus among the classifiers is also proposed which is formulated as a multiplicative part of the classifier weights. Simulation experiments in closed-set speaker identification have shown that the method of weight estimation described improved the identification rates of both linear and logarithmic opinion type combination schemes. In the second part, a completely different rank-based classifier combination technique is studied. The combination scheme is based on Dempster-Shafer the ory of evidence as the theory is well suited for the representation and processing of uncertain or missing information. The method is based on the extraction of ranking statistics. These statistics are used to define confusion matrices for different ranks. Using these rank confusion matrices, the speakers are clustered into model sets where they share set specific properties. Some of these model sets are used to reflect the strengths and weaknesses of the classifiers where some others carry speaker dependent ranking statistics of the corresponding classifier. These information sets from multiple classifiers are combined to arrive at a joint decision. For the combination task, a rule-based algorithm is developed where Dempster's rule of combination is applied in the final step. Our simulation re sults have shown that the proposed method perform better compared to some other rank-based combination methods.
Benzer Tezler
- Improved microphone array design with statistical speaker identification methods
İstatiksel ses tanıma metodları ile gelişmiş mikrofon dizisi tasarımı
KADİR ERDEM DEMİR
Yüksek Lisans
İngilizce
2016
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolIşık ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. MUSTAFA TANER ESKİL
PROF. DR. MUSTAFA KARAMAN
- Adli amaçlı konuşma ve konuşmacı tanımadaki etmenlerden biri olarak Prosody (Bürün) öğeleri
Prosody elements as one of the factors in forensic speech and speaker recognation
EKREM MALKOÇ
Yüksek Lisans
Türkçe
2001
Adli TıpAnkara ÜniversitesiDisiplinlerarası Adli Tıp Ana Bilim Dalı
PROF.DR. İCLAL ERGENÇ
- Investigation of deep neural models for supervised emotional speech synthesis with limited data
Sınırlı veri ile denetimli duygusal konuşma sentezi için derin sinir modellerinin incelenmesi
HUDA MOHAMMED MOHAMMED BARAKAT
Doktora
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÖzyeğin ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. CENK DEMİROĞLU
- Ses sinyallerinden yaş grubu ve cinsiyet bilgisinin tahmin edilmesi
Estimating age group and gender information from speech signals
ABDULHALIK OĞUZ
Yüksek Lisans
Türkçe
2018
Bilim ve TeknolojiSiirt ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ YILMAZ KAYA
- Yabancı diller yüksekokulu öğretim elemanlarının ders gözlemlerine ilişkin görüşlerinin incelenmesi
An investigation of instructors' views on course observation at school of foreign languages
BETÜL TUNÇYÜREK
Yüksek Lisans
Türkçe
2019
Eğitim ve ÖğretimDokuz Eylül ÜniversitesiEğitim Bilimleri Ana Bilim Dalı
DR. ÖĞR. ÜYESİ NAMIK ÖZTÜRK