Ayrışık sözcük tabanlı türkçe konuşmacı tanıma sistemi geliştirme ve anahtar kelime seçiminin konuşmacı tanıma başarımına etkisinin incelenmesi
Developing an isolated word based turkish speaker recognition system and investigation of the keyword choice on the speaker recognition performance
- Tez No: 396983
- Danışmanlar: DOÇ. DR. ÖZGÜL SALOR DURNA
- Tez Türü: Yüksek Lisans
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2015
- Dil: Türkçe
- Üniversite: Gazi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 75
Özet
Bu tez çalışması kapsamında, ayrışık sözcük kullanımıyla bir konuşmacı tanıma sistemi geliştirilmiştir. Geliştirilen sistemde öznitelik olarak Mel Frekans Kepstrum Katsayıları (Mel Frequency Cepstrum Coefficient - MFCC) ve kodlanmış çizgisel frekans spektrumu (Line Spectral Frequency - LSF) kullanılmıştır. Çalışma kapsamında, geliştirilen konuşmacı tanıma sisteminin başarımı, seçilen özniteliklere ve kullanılan anahtar kelimelere göre değerlendirilmiştir. Çalışmanın yapılabilmesi için, 12 erkek ve 4 kadın konuşmacının 48 farklı kelimeyi 6'şar kez tekrarladığı bir veri tabanı oluşturulmuştur. Kayıtlar, ses yalıtımı olan gürültüsüz bir kayıt stüdyosunda; 16 kHz örnekleme frekansı ve Logitech marka kablosuz bir mikrofon ile alınmıştır. Kayıtlar bir konuşmacı için günün farklı saatleri seçilen üç ya da dört oturumda yapılmış ve kişinin ses değişkenliğinin veri tabanına yansıtılması sağlanmıştır. Tezin ilk bölümünde, konuşmacı veri tabanı oluşturulduktan sonra, ikinci bölümde öznitelik olarak MFCC'ler kullanılarak konuşmacı tanıma sistemi oluşturulmuş ve sistemin başarımı ölçülmüştür. Üçüncü bölümde ise, MELP ile kodlanmış ve kod çözülerek tekrar oluşturulmuş konuşma sinyali sisteme giriş olarak uygulanarak, geliştirilen sistemin konuşmacı tanıma başarımının kodlamaya karşı gürbüzlüğü değerlendirilmiştir. Dördüncü olarak, kodlanmış ve kod çözülmüş sözcüklerin konuşmacı tanıma sisteminde yol açtığı başarım düşüşünü azaltmak üzere, öznitelik olarak MELP konuşma kodlama algoritmasının kod sözcüklerini kullanan bir konuşmacı tanıma sistemi geliştirilmiştir. Yalnızca MFCC'ler öznitelik olarak kullanıldığı zaman %96 olarak elde edilen başarımın, kodlanmış ve kod çözülmüş sözcükler sisteme giriş olarak verildiğinde başarımın %60'a düştüğü görülmüştür. Kodlanmaya karşı dayanıklı bir sistem geliştirmek için oluşturulan ve MELP kod sözcüklerinin kullanan sistemin konuşmacı tanıma başarımının ise %71'e yükseldiği gözlenmiştir. Son bölümde ise, geliştirilen temel sistemin seçilen anahtar sözcüğe göre başarımı ölçülmüştür. Yapılan testler sonucunda, sesletimi kolay, yabancı kökenli olmayan sözcüklerde konuşmacı tanıma başarımının, diğer sözcüklere göre daha yüksek olduğu gözlenmiştir.
Özet (Çeviri)
In this thesis, an isolated-word-based speaker recognition system is developed. Mel Frequency Cepstrum Coefficients (MFCC) and Line Spectral Frequencies (LSF) are used as the features of the developed speaker recognition system. This system's performance is evaluated for both keyword choice and feature selection. In order to perform this study, a database has been created consisting of 48 words per speaker taken from 12 men and 4 women and each word is recorded 6 times for each participant. Records are acquired at 16 kHz sampling frequency in a professional recording studio, which is noiseless and has sound insulation, using Logitech wireless microphone. The records acquired 3 or 4 sessions, which were achieved at different times of the day, for each participant to reflect the sound variability of the human vocal tract on the database. In the first part of the thesis, the speaker database has been prepared. In the second section, speaker recognition system has been developed and the system performance has been measured for the system operating with MFCC as the attributes. In the third section, system performance and robustness of the system against coding has been evaluated when MELP coded and decoded speech is provided to the system as the input signal. In the fourth part of the thesis, to increase the robustness of the system against coding, a new speaker recognition system has been proposed, using the MELP coder's codebook as features. When MFCCs are used for speaker recognition as features, the performance of the system has been 96%; however, if coded and decoded speech signal is used as dataset on the same system, the performance of the system has been reduced to 60%. For the speaker recognition system, which uses MELP coder's codebook as features, the performance of the system has been found to be 71%. In the final section, the performance of the baseline system is analyzed with respect to the keyword choice. It has been observed that the words, which have easy pronunciation and are not foreign origin, show higher performance than the others.
Benzer Tezler
- Bir hece-tabanlı Türkçe sesli ifade tanıma sisteminin tasarımı ve gerçekleştirimi
A syllable-based speech recognition system design and implementation for Turkish language
BURCU CAN
Yüksek Lisans
Türkçe
2007
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
Y.DOÇ.DR. HARUN ARTUNER
- Örüntü tanıma yöntemleri kullanarak konuşmacı bağımlı ayrışık sözcük tanıma
Speaker dependent isolated word recognition using pattern recognition techniques
BETÜL KESKİN
Yüksek Lisans
Türkçe
2015
Elektrik ve Elektronik MühendisliğiGazi ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. ÖZGÜL SALOR DURNA
- Akıllı ev aletleri için konuşmacı bağımlı ayrışık sözcük tanıma sistemi
Speaker dependent isolated word system designed for smart home appliances
ADEM ÇİÇEK
Yüksek Lisans
Türkçe
2015
Elektrik ve Elektronik MühendisliğiGazi ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. ÖZGÜL SALOR DURNA
- La dimension culturelle dans l'enseignement du FLE: La place et la fonction de la publicité dans la phase de la transmission de la culture française
Fransızca öğretiminde kültürel boyut: Reklâm bildirilerinin Fransız kültürünü aktarmadaki yeri ve işlevi
ÖZGE SÖNMEZ
Doktora
Fransızca
2012
DilbilimDokuz Eylül ÜniversitesiYabancı Diller Eğitimi Ana Bilim Dalı
PROF. DR. VELİ DOĞAN GÜNAY
- Hikâye anlatımı olarak mekân yapımı
(hi)storytelling through space-making
SAMET MOR
Doktora
Türkçe
2024
Mimarlıkİstanbul Teknik ÜniversitesiMimarlık Ana Bilim Dalı
PROF. DR. NURBİN PAKER KAHVECİOĞLU