Geri Dön

Çok katmanlı algılayıcı sinir ağı kullanarak konuşmacı tanıma sisteminde ayrık dalgacık dönüşümü temelli gürültü arındırmanın etkisi

The effect of denoising in speaker recognation system based on discreet wavelet transform using multilayer perceptron neural network

  1. Tez No: 482357
  2. Yazar: KÜBRA TANCI
  3. Danışmanlar: DOÇ. DR. MAHMUT HEKİM
  4. Tez Türü: Yüksek Lisans
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2017
  8. Dil: Türkçe
  9. Üniversite: Gaziosmanpaşa Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 56

Özet

Konuşmacı tanıma, bilgisayar sistemleri, elektronik, haberleşme ve yapay zeka alanlarında güncel ve önemli bir yer temsil eden insan-bilgisayar etkileşiminin bir parçasıdır. Ses işareti çok karmaşıktır ve çok sayıda örnek almayı gerektirirken, zaman ve frekans domeninden özellik çıkarımı analitik işlemler gerektirmektedir. Bu çalışmada, gürültü içeren ses kayıtlarına ayrık dalgacık dönüşümü (DWT) yöntemi kullanarak gürültüden arındırmanın, çok katmanlı algılayıcı sinir ağı (MLPNN) ile konuşmacı tanıma işleminde etkisi araştırılmaktadır. 5 konuşmacının günün 5 farklı saatinde 10 ayrı cümle okunmasıyla oluşturulmuş veri seti kullanılmıştır. Bu amaç için ilk olarak ses işaretleri örnekleme yapılarak ayrıklaştırılmış, eşit uzunluklarda segmentlere bölünen ses işaretlerini oluşturan her bir segmentin istatiksel parametreleri konuşmacı tanıma için bir MLPNN modeline giriş olarak kullanılmıştır. İkinci olarak, ses işaretlerini oluşturan her bir segment DWT yöntemi ile gürültüden arındırılmış ve aynı istatiksel parametrelerle elde edilen özellik vektörleri aynı sınıflayıcı modeline giriş olarak uygulanmıştır. DWT temelli gürültü arındırma yaklaşımında dalgacık türleri karşılaştırılmış ve konuşmacı doğru sınıflandırma oranı ortalamaları, gürültülü işarette %72.60, db2 dalgacığı kullanılan yaklaşımda %90.26 ve coif2 dalgacığı kullanılan yaklaşımda %97.70 oranlarına ulaşılmıştır. Sonuç olarak, ses işaretlerinden konuşmacı tanıma sisteminde DWT ile gürültü arındırmanın önemli derecede katkısı olmuştur.

Özet (Çeviri)

Speaker recognation is an important part of human-computer interaction which represents an important area of computer systems, electronic, communication and artificial intelligence. Speech signal is very complex and while it requires to take lots of samples, the extraction of samples from its time and frequency domain needs to analytical methods. In this study, the effect of denoising in speaker recognition system based on discrete wavelet transform (DWT) using multilayer perceptron neural network (MLPNN) model is investigated. The data set which is used is formed 10 sentences that 5 speaker was read at 5 different times in a day. For this aim, firstly the audio signals are discretized by sampling and dividen into equal length segments, and the statistical features obtained by means of this approach are useas the inputs of MLPNN model. Secondly, each segment that obtained audio signals, are denoised with DWT and the same statistical features are used as the inputs of the same MLPNN model. The wavelet types of the denoising approach based on DWT are compared and the speaker correct classification ratio in noisy signal is %72.60, in the appraoch used db2 wavelet type is %90.26 and the approach used coif2 wavelet type is %97.70. As a result, denoising with DWT has serious contribution in speaker recognition systems with audio signals.

Benzer Tezler

  1. Classification of pediatric snoring episodes using deep convolutional neural networks

    Pediyatrik horlama episodlarının derin evrişimsel sinir ağları ile sınıflandırılması

    OZAN FIRAT CİVANER

    Yüksek Lisans

    İngilizce

    İngilizce

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. MUSTAFA ERSEL KAMAŞAK

  2. El yazısı karakter tanıma ve resim sınıflandırmada derin öğrenme yaklaşımları

    Deep learning approaches in handwritting character recognition and image classification

    AOUDOU SALOUHOU

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFatih Sultan Mehmet Vakıf Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ BERNA KİRAZ

  3. Aircraft detection using deep learning

    Derin öğrenme kullanarak hava aracı tespiti

    UTKU MUTLU

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    İletişim Sistemleri Ana Bilim Dalı

    PROF. DR. SEDEF KENT PINAR

  4. Reinforcement learning-driven ensemble neural networks for heart disease prediction

    Kalp hastalığı tahmini için takviyeli öğrenme tabanlı topluluk sinir ağları

    ÖZGE HÜSNİYE NAMLI DAĞ

    Doktora

    İngilizce

    İngilizce

    2025

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DOÇ. DR. SEDA YANIK ÖZBAY

  5. Designing a system to distinguish amongst main Arabic dialects

    Ana Arap lehçeleri arasında ayrım yapmak için bir sistem tasarlama

    DHEYAA HUSSEIN HAMMAD ALHELAL

    Doktora

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAltınbaş Üniversitesi

    Elektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ TİMUR İNAN