Geri Dön

Çok katmanlı algılayıcı sinir ağı kullanarak konuşmacı tanıma sisteminde ayrık dalgacık dönüşümü temelli gürültü arındırmanın etkisi

The effect of denoising in speaker recognation system based on discreet wavelet transform using multilayer perceptron neural network

  1. Tez No: 482357
  2. Yazar: KÜBRA TANCI
  3. Danışmanlar: DOÇ. DR. MAHMUT HEKİM
  4. Tez Türü: Yüksek Lisans
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2017
  8. Dil: Türkçe
  9. Üniversite: Gaziosmanpaşa Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 56

Özet

Konuşmacı tanıma, bilgisayar sistemleri, elektronik, haberleşme ve yapay zeka alanlarında güncel ve önemli bir yer temsil eden insan-bilgisayar etkileşiminin bir parçasıdır. Ses işareti çok karmaşıktır ve çok sayıda örnek almayı gerektirirken, zaman ve frekans domeninden özellik çıkarımı analitik işlemler gerektirmektedir. Bu çalışmada, gürültü içeren ses kayıtlarına ayrık dalgacık dönüşümü (DWT) yöntemi kullanarak gürültüden arındırmanın, çok katmanlı algılayıcı sinir ağı (MLPNN) ile konuşmacı tanıma işleminde etkisi araştırılmaktadır. 5 konuşmacının günün 5 farklı saatinde 10 ayrı cümle okunmasıyla oluşturulmuş veri seti kullanılmıştır. Bu amaç için ilk olarak ses işaretleri örnekleme yapılarak ayrıklaştırılmış, eşit uzunluklarda segmentlere bölünen ses işaretlerini oluşturan her bir segmentin istatiksel parametreleri konuşmacı tanıma için bir MLPNN modeline giriş olarak kullanılmıştır. İkinci olarak, ses işaretlerini oluşturan her bir segment DWT yöntemi ile gürültüden arındırılmış ve aynı istatiksel parametrelerle elde edilen özellik vektörleri aynı sınıflayıcı modeline giriş olarak uygulanmıştır. DWT temelli gürültü arındırma yaklaşımında dalgacık türleri karşılaştırılmış ve konuşmacı doğru sınıflandırma oranı ortalamaları, gürültülü işarette %72.60, db2 dalgacığı kullanılan yaklaşımda %90.26 ve coif2 dalgacığı kullanılan yaklaşımda %97.70 oranlarına ulaşılmıştır. Sonuç olarak, ses işaretlerinden konuşmacı tanıma sisteminde DWT ile gürültü arındırmanın önemli derecede katkısı olmuştur.

Özet (Çeviri)

Speaker recognation is an important part of human-computer interaction which represents an important area of computer systems, electronic, communication and artificial intelligence. Speech signal is very complex and while it requires to take lots of samples, the extraction of samples from its time and frequency domain needs to analytical methods. In this study, the effect of denoising in speaker recognition system based on discrete wavelet transform (DWT) using multilayer perceptron neural network (MLPNN) model is investigated. The data set which is used is formed 10 sentences that 5 speaker was read at 5 different times in a day. For this aim, firstly the audio signals are discretized by sampling and dividen into equal length segments, and the statistical features obtained by means of this approach are useas the inputs of MLPNN model. Secondly, each segment that obtained audio signals, are denoised with DWT and the same statistical features are used as the inputs of the same MLPNN model. The wavelet types of the denoising approach based on DWT are compared and the speaker correct classification ratio in noisy signal is %72.60, in the appraoch used db2 wavelet type is %90.26 and the approach used coif2 wavelet type is %97.70. As a result, denoising with DWT has serious contribution in speaker recognition systems with audio signals.

Benzer Tezler

  1. Classification of pediatric snoring episodes using deep convolutional neural networks

    Pediyatrik horlama episodlarının derin evrişimsel sinir ağları ile sınıflandırılması

    OZAN FIRAT CİVANER

    Yüksek Lisans

    İngilizce

    İngilizce

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. MUSTAFA ERSEL KAMAŞAK

  2. El yazısı karakter tanıma ve resim sınıflandırmada derin öğrenme yaklaşımları

    Deep learning approaches in handwritting character recognition and image classification

    AOUDOU SALOUHOU

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFatih Sultan Mehmet Vakıf Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ BERNA KİRAZ

  3. Aircraft detection using deep learning

    Derin öğrenme kullanarak hava aracı tespiti

    UTKU MUTLU

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    İletişim Sistemleri Ana Bilim Dalı

    PROF. DR. SEDEF KENT PINAR

  4. EKG işaretlerinden çok katmanlı algılayıcılı sinir ağı kullanarak aritmilerin tespiti

    ECG signals used on arrhytmia diagnosis with multilayer perceptraon neural network

    ERSİN ERSOY

    Yüksek Lisans

    Türkçe

    Türkçe

    2016

    Mekatronik MühendisliğiGaziosmanpaşa Üniversitesi

    Mekatronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. MAHMUT HEKİM

  5. Ayrıklaştırma yöntemleri ve yapay sinir ağı kullanarak asenkron motorlarda arıza teşhisi

    Fault diagnosis in induction motors using discretization methods and artificial neural network

    ZAFER DOĞAN

    Doktora

    Türkçe

    Türkçe

    2012

    Elektrik ve Elektronik MühendisliğiMarmara Üniversitesi

    Elektrik Eğitimi Ana Bilim Dalı

    YRD. DOÇ. DR. İSMAİL TEMİZ