Yapay sinir ağları ile kişilerin ses örneklerinden kimliklerinin tanınması
Recognizing speaker identification fron speech samples with artificial neural network
- Tez No: 58162
- Danışmanlar: DOÇ. DR. ABDURRAHMAN KARAMANCIOĞLU
- Tez Türü: Yüksek Lisans
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 1997
- Dil: Türkçe
- Üniversite: Afyon Kocatepe Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 63
Özet
ÖZET Bu tezde son yıllarda yaygın olarak kullanılan Yapay Sinir Ağları (YSA) yönteminin konuşan kişinin kimliğinin tanınması (speaker identification) amacıyla kullanımı uygulaması yapılmaktadır. Genelde yapay sinir ağlarının kullanıldığı ses teknolojisi ile yapılan uygulamalarda sesli ve sessiz sesler ile ve daha da ilerisi kelimelerin, cümlelerin ve sürekli konuşmanın tanınması için önceden yapılan çalışmalar temel olarak alınmıştır. Ses örneklerinin YSA da kullanılması için bu referans bilgilerden yararlanılarak sesin Matematiksel Modeli bir algoritma yardımıyla elde edilmiştir. Sesin matematiksel modelini elde ederken Doğrusal Öngörü Ana/izi (IPC -Lineer Predictive Coding-) ve DFT (Discrete Fourier Transfom) analizleri yapılmıştır. Bu analizler için de sesin bilgisayarda bulunan spektrumundan yararlanılmıştır. Bu uygulamada insanların kimliklerinin tanınması için sadece 'a' sesinden yararlanılmıştır, 'a' sesinin periyodik işaretlerin toplamından oluşmasından yararlanılarak her periyot için 'Hamming Pencereleme Metodu' ile 28 adet katsayı elde edilmiştir. Elde ettiğimiz bu 28 katsayıdan 16 tanesi DFT analizi ile 12 tanesi ise LPC analizi ile bulunmuştur. Her kişinin ses örnekleri ile elde edilen bu 28 adet katsayılar grubu YSA yöntemi olarak kullandığımız 'hatanın geriye yayılarak düzeltilmesi' (Backpropagation) algoritması ile çıkışta '0' ve '1' çıktısı verecek şekilde eğitilerek, konuşan kişinin tanınması uygulaması yapılmıştır. r YSA yöntemi ile ilgili bilgi ikinci bölümde verilmiş ve Backpropagation yönteminin algoritması anlatılmaya çalışılmıştır. Sesin matematiksel modellenmesi için kullanılan LPC ve DFT analizleri de ileriki bölümlerde tartışılacak ve yorumlanacaktır. Altıncı bölümde uygulamanın nasıl yapıldığı, son bölümde ise sonuçlar ve öneriler yer almaktadır. Vİİİ
Özet (Çeviri)
ABSTRACT In this thesis an artificial neural network (ANN) is implemented, which has been used frequently as an implementation model in recent years, to recognize speaker identification. In general, in the implementation through this kind of voice tecnology for the identification of vowel and consonant letters, evenmore words and speech are based on the previous studies. This kind of reference information were applied for the usage of voice patterns in the ANN. The analyses of lineer predictive coding and discrete fourier transform had been made to obtain the mathematical model of voice. For these analyses the sound of spectrums which have been in computer has been used. In this implementation only the letter of 'a' was applied to recognize the identifications of people. Using a backround and the hamming window method 28 coefficents have been obtained for each period. Of those 28 coefficents, 16 were obtained by the analysis of DFT and 12 were obtained by the analysis of LPC. These 28 coefficent groups which had been obtained from various speakers, have been used to have '0' or T as an output, depending on the speakers identity, by using Backpropagatbn algoritm. A backround on ANN have been given and the algoritm of Backpropagation Model's are explained in the second section. The analyses of LPC and DFT, which have been used for mathematical model of sounds, is discussed and interpreted in the following sections. In the sixth section, how the implementation have been made will take place. In the final section conclusions are presented. IX
Benzer Tezler
- Ses sinyallerinden yaş grubu ve cinsiyet bilgisinin tahmin edilmesi
Estimating age group and gender information from speech signals
ABDULHALIK OĞUZ
Yüksek Lisans
Türkçe
2018
Bilim ve TeknolojiSiirt ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ YILMAZ KAYA
- Automatic posture evaluation for professional voice users
Profesyonel ses kullanıcıları için otomatik postür değerlendirmesi
ÇAĞATAY DEMİREL
Yüksek Lisans
İngilizce
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. GÖKHAN İNCE
- Voice recognition system with score level fusion methods and embedded system design
Skor seviyesi füzyon metotları ile ses tanıma sistemi ve gömülü sistem tasarımı
CİHAN AKIN
Yüksek Lisans
İngilizce
2019
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. MÜRVET KIRCI
- Learning weights of losses on multiscale in crowd counting
Kalabalık sayımında çoklu ölçek kayıplarının ağırlılarının öğrenilmesi
DERYA UYSAL
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. ULUĞ BAYAZIT
- Derin öğrenme yöntemleri ile yüz görüntülerinden yaş kestirimi
Age estimation from facial images using deep neural networks
YUSUF ÇAĞRI DAŞKIN
Yüksek Lisans
Türkçe
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik ÜniversitesiHarita Mühendisliği Ana Bilim Dalı
DOÇ. DR. FÜSUN BALIK ŞANLI