Geri Dön

Frequency analysis of speaker identification performance

Konuşmacı tanıma başarımının sıklık analizi

  1. Tez No: 95394
  2. Yazar: ÖZGÜR DEVRİM ORMAN
  3. Danışmanlar: YRD. DOÇ. DR. LEVENT M. ARSLAN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2000
  8. Dil: İngilizce
  9. Üniversite: Boğaziçi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 39

Özet

ÖZET KONUŞMACI TANIMA BAŞARIMININ SIKLIK ANALİZİ Konuşmacı tanıma uygulamalarının ilgi çekiciliği telefon ve Internet üzerinden verilen, diyalog içeren hizmetlere olan gereksinimin artışına paralel olarak artmaktadır. Sözkonusu hizmetlere yüksek güvenlik gereksinimi olan telefon ve Internet bankacığını örnek verebiliriz. Bu çalışmada konuşmacı tanıma sürecinde kullanılan konuşmacı öznitelik yöneylerinin içerdikleri sıklık bantlarının tanıma başanmma etkileri geliştirilen nesnel yöntemler ve dinleyici testleri ile ortaya çıkarılmaya çalışılmıştır. Nesnel test sonuçlarına göre, konuşmacıların aynştınlmasında 0-1000 Hz ve 3000-4500 Hz sıklık bantlarının diğer sıklık bantlarından daha etkin oldukları bulunmuştur. Bununla birlikte, dinleyici test sonuçlan ise insanlar tarafından konuşmacıların aynştınlmasında 4000-6000 Hz frekans bandının önemini ortaya koymaktadır. Yapılan çalışmalann sonucunda incelenen her bir sıklık bantının ayn ayn başanma etkileri belirlenip, bu verilerin doğrultusunda konuşmacı tanıma sistemlerinde kullanılmak üzere yeni bir süzgeç öbeği önerilmiştir. Söz konusu süzgeç öbeğinin uygulamalar sonucunda konuşmacı tanıma sistemlerinde kullanılagelen mel-skalası süzgeç öbeğinden daha iyi bir başanm gösterdiği gözlenmiştir.

Özet (Çeviri)

IV ABSTRACT FREQUENCY ANALYSIS OF SPEAKER IDENTIFICATION PERFORMANCE Speaker identification applications become more and more popular, because of the increasing demand of interactive services over the telephone and the Internet, such as telephone and Internet banking which require high levels of security. In this thesis, speaker identification performance dependency on the choice of frequency bands is investigated for both objective and subjective tests. According to objective test results, it has been shown that 0-1000 Hz and 3000-4500 Hz frequency bands are more significant in speaker discrimination when compared to other frequencies. However, observed listener responses in subjective tests indicate the importance of 4000-6000 Hz frequency band for speaker decisions of humans. Affect of each analyzed frequency band on speaker identification performance is determined, and a new filter bank design for speaker identification systems is proposed. In the experimental study, it has been depicted that, this filter bank gives better identification performance than commonly used mel-scale filter bank.

Benzer Tezler

  1. Konuşmacı tanıma yöntemlerinin karşılaştırmalı analizi

    A comparative study of speaker recognition techniques

    CEMAL HANİLÇİ

    Yüksek Lisans

    Türkçe

    Türkçe

    2007

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolUludağ Üniversitesi

    Elektronik Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. FİGEN ERTAŞ

  2. Discrimination analysis of lip motion features for multimodal speaker identification and speech-reading

    Çok-kipli konuşmacı ve konuşma tanıma uygulamaları için dudak devinim öz niteliklerinde ayırıcı analiz

    HASAN ERTAN ÇETİNGÜL

    Yüksek Lisans

    İngilizce

    İngilizce

    2005

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKoç Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. MURAT TEKALP

    YRD. DOÇ. DR. ENGİN ERZİN

  3. An optimized text-independent speaker recognition system using feed forward neural network

    Optimize edilmiş ileri yapay sinir ağı kullanılan metinden bağımsız konuşmacı anıma sistemi

    SAEEDA MEFTAH SALEM ELTANASHI

    Yüksek Lisans

    İngilizce

    İngilizce

    2020

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKarabük Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ FERHAT ATASOY

  4. Türkçe sesler ile konuşmacı kimliğinin doğrulanması/belirlenmesi

    Verification/identification of speaker identity with turkish voices

    HAVVA ÇELİKTAŞ

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Elektrik ve Elektronik MühendisliğiBursa Teknik Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. CEMAL HANİLÇİ

  5. Makine öğrenme algoritmalarıyla konuşmacı tanılaması

    Speaker identification with machine learning algorithms

    KORAY ÖZTÜRK

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Elektrik ve Elektronik MühendisliğiDoğuş Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ TEMEL SÖNMEZOCAK