Geri Dön

Metinden bağımsız konuşmacı tanıma sistemlerinin incelenmesi ve gerçekleştirilmesi

Investigation and implementation of text-independent speaker identification sistems

  1. Tez No: 299581
  2. Yazar: SUIKUM KARASARTOVA
  3. Danışmanlar: PROF. DR. H. GÖKHAN İLK
  4. Tez Türü: Yüksek Lisans
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Vektör Nicemleme, Gauss Karışım Modeli, öznitelik çıkarma, Vector Quantization, Gaussian Mixture Model, feature extraction
  7. Yıl: 2011
  8. Dil: Türkçe
  9. Üniversite: Ankara Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 49

Özet

Bu tez çalışmasında, Vektör Nicemleme (VQ) ve Gauss Karışım Modeli (GMM) tabanlı kapalı set, metinden bağımsız konuşmacı tanıma uygulamaları geliştirilmiştir.ELSRSD veri tabanından faydalanarak, her bir konuşmacıya ait konuşma sinyalleri için MFCC, ?MFCC, LPCC kepstral katsayıları çıkarılarak öznitelik vektörler kümesi oluşturulmuştur. Bu vektörler LBG ve Beklentinin Maksimumlaştırılması (BM) algoritmalarıyla modellenmiştir. Eğitim ve test aşamalarında öznitelik katsayılarının sayısı, eğitim ve test süreleri, kod vektör boyutu ve karışım bileşen sayıları değiştirerek, konuşmacı tanıma performansına olan etkileri incelenip optimum değerleri belirlenmiştir. Similasyonlar sonucunda VQ sınıflandırıcı, 12 MFCC öznitelik, eğitim süresi 14.1-23.8 saniye arasında değişen veri seti kullandığında, test süresi 3 saniye olarak alındığında 20 konuşmacı için başarım %100'e çıkarılabilmiştir.Eylül 2011, 42 sayfa

Özet (Çeviri)

In this thesis, Vector Quantization and Gaussian Mixture Model based text-independent speaker applications have been designed for a closed set of speakersUsing speech signals obtained from ELSRSD data base, feature vectors MFCC, ?MFCC and LPCC for every speaker has been extracted. Then these feature vectors have been classified using LBG and Expectation Maximization algorithms. During training and testing processes influences of number of cepstral features, duration of train and test data, size of code vectors and number of Gaussian mixtures on systems' performance have been explored. As a result optimum values of the system have been determined. After simulations, using Vector Quantization model and MFCC as feature vectors, 14.1-23.8 seconds of training data and 3 seconds of testing data system performance can be reached 100% for a closed set of 20 speakers.September 2011, 42 pages

Benzer Tezler

  1. Konuşmacı tanıma yöntemlerinin karşılaştırmalı analizi

    A comparative study of speaker recognition techniques

    CEMAL HANİLÇİ

    Yüksek Lisans

    Türkçe

    Türkçe

    2007

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolUludağ Üniversitesi

    Elektronik Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. FİGEN ERTAŞ

  2. Konuşmacı tanımada map uyarlamalı sınıflandırıcılar

    Map adapted classifiers for speaker recognition

    CEMAL HANİLÇİ

    Doktora

    Türkçe

    Türkçe

    2013

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolUludağ Üniversitesi

    Elektronik Mühendisliği Bölümü

    YRD. DOÇ. FİGEN ERTAŞ

  3. Bilgisayar destekli ses tanıma sistemi tasarımı

    Computer aided voice recognition system design

    MEHMET DENİZ DEMİRCİ

    Yüksek Lisans

    Türkçe

    Türkçe

    2005

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    Y.DOÇ.DR. OĞUZHAN ÖZTAŞ

  4. Comparison of text-independent speaker verification systems in a multi-class, semi-automatic detection scenario

    Metinden bağımsız konuşmacı doğrulama sistemlerinin çok sınıflı, yarı otomatik bir tanıma senaryosunda karşılaştırılması

    FATİH YEŞİL

    Yüksek Lisans

    İngilizce

    İngilizce

    2013

    Elektrik ve Elektronik MühendisliğiÖzyeğin Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. CENK DEMİROĞLU

  5. Grafik programlama kullanarak kepstrum analizi ve yapay sinir ağı ile konuşmacı tanıma

    Speaker identification with cepstrum analysis and artificial neural network using graphical programming

    ORHAN ÖZHAN

    Doktora

    Türkçe

    Türkçe

    1999

    Elektrik ve Elektronik MühendisliğiYıldız Teknik Üniversitesi

    Elektrik Mühendisliği Ana Bilim Dalı

    PROF. DR. HALİT PASTACI