Frequency analysis of speaker identification performance
Konuşmacı tanıma başarımının sıklık analizi
- Tez No: 95394
- Danışmanlar: YRD. DOÇ. DR. LEVENT M. ARSLAN
- Tez Türü: Yüksek Lisans
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2000
- Dil: İngilizce
- Üniversite: Boğaziçi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 39
Özet
ÖZET KONUŞMACI TANIMA BAŞARIMININ SIKLIK ANALİZİ Konuşmacı tanıma uygulamalarının ilgi çekiciliği telefon ve Internet üzerinden verilen, diyalog içeren hizmetlere olan gereksinimin artışına paralel olarak artmaktadır. Sözkonusu hizmetlere yüksek güvenlik gereksinimi olan telefon ve Internet bankacığını örnek verebiliriz. Bu çalışmada konuşmacı tanıma sürecinde kullanılan konuşmacı öznitelik yöneylerinin içerdikleri sıklık bantlarının tanıma başanmma etkileri geliştirilen nesnel yöntemler ve dinleyici testleri ile ortaya çıkarılmaya çalışılmıştır. Nesnel test sonuçlarına göre, konuşmacıların aynştınlmasında 0-1000 Hz ve 3000-4500 Hz sıklık bantlarının diğer sıklık bantlarından daha etkin oldukları bulunmuştur. Bununla birlikte, dinleyici test sonuçlan ise insanlar tarafından konuşmacıların aynştınlmasında 4000-6000 Hz frekans bandının önemini ortaya koymaktadır. Yapılan çalışmalann sonucunda incelenen her bir sıklık bantının ayn ayn başanma etkileri belirlenip, bu verilerin doğrultusunda konuşmacı tanıma sistemlerinde kullanılmak üzere yeni bir süzgeç öbeği önerilmiştir. Söz konusu süzgeç öbeğinin uygulamalar sonucunda konuşmacı tanıma sistemlerinde kullanılagelen mel-skalası süzgeç öbeğinden daha iyi bir başanm gösterdiği gözlenmiştir.
Özet (Çeviri)
IV ABSTRACT FREQUENCY ANALYSIS OF SPEAKER IDENTIFICATION PERFORMANCE Speaker identification applications become more and more popular, because of the increasing demand of interactive services over the telephone and the Internet, such as telephone and Internet banking which require high levels of security. In this thesis, speaker identification performance dependency on the choice of frequency bands is investigated for both objective and subjective tests. According to objective test results, it has been shown that 0-1000 Hz and 3000-4500 Hz frequency bands are more significant in speaker discrimination when compared to other frequencies. However, observed listener responses in subjective tests indicate the importance of 4000-6000 Hz frequency band for speaker decisions of humans. Affect of each analyzed frequency band on speaker identification performance is determined, and a new filter bank design for speaker identification systems is proposed. In the experimental study, it has been depicted that, this filter bank gives better identification performance than commonly used mel-scale filter bank.
Benzer Tezler
- Konuşmacı tanıma yöntemlerinin karşılaştırmalı analizi
A comparative study of speaker recognition techniques
CEMAL HANİLÇİ
Yüksek Lisans
Türkçe
2007
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolUludağ ÜniversitesiElektronik Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. FİGEN ERTAŞ
- Discrimination analysis of lip motion features for multimodal speaker identification and speech-reading
Çok-kipli konuşmacı ve konuşma tanıma uygulamaları için dudak devinim öz niteliklerinde ayırıcı analiz
HASAN ERTAN ÇETİNGÜL
Yüksek Lisans
İngilizce
2005
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKoç ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. MURAT TEKALP
YRD. DOÇ. DR. ENGİN ERZİN
- An optimized text-independent speaker recognition system using feed forward neural network
Optimize edilmiş ileri yapay sinir ağı kullanılan metinden bağımsız konuşmacı anıma sistemi
SAEEDA MEFTAH SALEM ELTANASHI
Yüksek Lisans
İngilizce
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKarabük ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ FERHAT ATASOY
- Türkçe sesler ile konuşmacı kimliğinin doğrulanması/belirlenmesi
Verification/identification of speaker identity with turkish voices
HAVVA ÇELİKTAŞ
Yüksek Lisans
Türkçe
2019
Elektrik ve Elektronik MühendisliğiBursa Teknik ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. CEMAL HANİLÇİ
- Makine öğrenme algoritmalarıyla konuşmacı tanılaması
Speaker identification with machine learning algorithms
KORAY ÖZTÜRK
Yüksek Lisans
Türkçe
2024
Elektrik ve Elektronik MühendisliğiDoğuş ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ TEMEL SÖNMEZOCAK