Geri Dön

Yapay sinir ağları ile kişilerin ses örneklerinden kimliklerinin tanınması

Recognizing speaker identification fron speech samples with artificial neural network

  1. Tez No: 58162
  2. Yazar: MURAT CANSIZ
  3. Danışmanlar: DOÇ. DR. ABDURRAHMAN KARAMANCIOĞLU
  4. Tez Türü: Yüksek Lisans
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 1997
  8. Dil: Türkçe
  9. Üniversite: Afyon Kocatepe Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 63

Özet

ÖZET Bu tezde son yıllarda yaygın olarak kullanılan Yapay Sinir Ağları (YSA) yönteminin konuşan kişinin kimliğinin tanınması (speaker identification) amacıyla kullanımı uygulaması yapılmaktadır. Genelde yapay sinir ağlarının kullanıldığı ses teknolojisi ile yapılan uygulamalarda sesli ve sessiz sesler ile ve daha da ilerisi kelimelerin, cümlelerin ve sürekli konuşmanın tanınması için önceden yapılan çalışmalar temel olarak alınmıştır. Ses örneklerinin YSA da kullanılması için bu referans bilgilerden yararlanılarak sesin Matematiksel Modeli bir algoritma yardımıyla elde edilmiştir. Sesin matematiksel modelini elde ederken Doğrusal Öngörü Ana/izi (IPC -Lineer Predictive Coding-) ve DFT (Discrete Fourier Transfom) analizleri yapılmıştır. Bu analizler için de sesin bilgisayarda bulunan spektrumundan yararlanılmıştır. Bu uygulamada insanların kimliklerinin tanınması için sadece 'a' sesinden yararlanılmıştır, 'a' sesinin periyodik işaretlerin toplamından oluşmasından yararlanılarak her periyot için 'Hamming Pencereleme Metodu' ile 28 adet katsayı elde edilmiştir. Elde ettiğimiz bu 28 katsayıdan 16 tanesi DFT analizi ile 12 tanesi ise LPC analizi ile bulunmuştur. Her kişinin ses örnekleri ile elde edilen bu 28 adet katsayılar grubu YSA yöntemi olarak kullandığımız 'hatanın geriye yayılarak düzeltilmesi' (Backpropagation) algoritması ile çıkışta '0' ve '1' çıktısı verecek şekilde eğitilerek, konuşan kişinin tanınması uygulaması yapılmıştır. r YSA yöntemi ile ilgili bilgi ikinci bölümde verilmiş ve Backpropagation yönteminin algoritması anlatılmaya çalışılmıştır. Sesin matematiksel modellenmesi için kullanılan LPC ve DFT analizleri de ileriki bölümlerde tartışılacak ve yorumlanacaktır. Altıncı bölümde uygulamanın nasıl yapıldığı, son bölümde ise sonuçlar ve öneriler yer almaktadır. Vİİİ

Özet (Çeviri)

ABSTRACT In this thesis an artificial neural network (ANN) is implemented, which has been used frequently as an implementation model in recent years, to recognize speaker identification. In general, in the implementation through this kind of voice tecnology for the identification of vowel and consonant letters, evenmore words and speech are based on the previous studies. This kind of reference information were applied for the usage of voice patterns in the ANN. The analyses of lineer predictive coding and discrete fourier transform had been made to obtain the mathematical model of voice. For these analyses the sound of spectrums which have been in computer has been used. In this implementation only the letter of 'a' was applied to recognize the identifications of people. Using a backround and the hamming window method 28 coefficents have been obtained for each period. Of those 28 coefficents, 16 were obtained by the analysis of DFT and 12 were obtained by the analysis of LPC. These 28 coefficent groups which had been obtained from various speakers, have been used to have '0' or T as an output, depending on the speakers identity, by using Backpropagatbn algoritm. A backround on ANN have been given and the algoritm of Backpropagation Model's are explained in the second section. The analyses of LPC and DFT, which have been used for mathematical model of sounds, is discussed and interpreted in the following sections. In the sixth section, how the implementation have been made will take place. In the final section conclusions are presented. IX

Benzer Tezler

  1. Ses sinyallerinden yaş grubu ve cinsiyet bilgisinin tahmin edilmesi

    Estimating age group and gender information from speech signals

    ABDULHALIK OĞUZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    Bilim ve TeknolojiSiirt Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ YILMAZ KAYA

  2. Automatic posture evaluation for professional voice users

    Profesyonel ses kullanıcıları için otomatik postür değerlendirmesi

    ÇAĞATAY DEMİREL

    Yüksek Lisans

    İngilizce

    İngilizce

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. GÖKHAN İNCE

  3. Voice recognition system with score level fusion methods and embedded system design

    Skor seviyesi füzyon metotları ile ses tanıma sistemi ve gömülü sistem tasarımı

    CİHAN AKIN

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. MÜRVET KIRCI

  4. Learning weights of losses on multiscale in crowd counting

    Kalabalık sayımında çoklu ölçek kayıplarının ağırlılarının öğrenilmesi

    DERYA UYSAL

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. ULUĞ BAYAZIT

  5. Derin öğrenme yöntemleri ile yüz görüntülerinden yaş kestirimi

    Age estimation from facial images using deep neural networks

    YUSUF ÇAĞRI DAŞKIN

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik Üniversitesi

    Harita Mühendisliği Ana Bilim Dalı

    DOÇ. DR. FÜSUN BALIK ŞANLI