Geri Dön

Spektrogram tekniği kullanılarak derin öğrenme yöntemleri ile ses tanıma

Sound recognition with deep learning methods using spectrogram technique

  1. Tez No: 568103
  2. Yazar: FERDİ KOÇ
  3. Danışmanlar: DOÇ. DR. RIDVAN SARAÇOĞLU
  4. Tez Türü: Yüksek Lisans
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2019
  8. Dil: Türkçe
  9. Üniversite: Van Yüzüncü Yıl Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 84

Özet

Ses tanıma insan sesinin bir mikrofon vasıtasıyla bilgisayar tarafından algılanarak tanınması işlemidir. Gelişen teknoloji sürecinde kendine önemli bir yer oluşturmaya başlamıştır. Bu çalışmada, daha önceden kaydedilmiş konuşma komutlarının tanınması için derin öğrenme yöntemleri kullanılmıştır. İki boyutlu derin öğrenme yapılarında işlenmek üzere ses verileri spektogram yöntemi kullanılarak görüntüye çevrilmiştir. Spektogram yöntemi hızlı fourier dönüşümü temelli alt örnekleme tekniğidir. Beş farklı evrişimsel sinir ağı modeli oluşturularak spektogram tekniği ile elde edilen görüntülerin sınıflandırılması gerçekleştirilmiştir. Karşılaştırmalı analiz kapsamında veri seti ayrı kategoriler halinde farklı sınıf sayısına bölünmüştür. Sınıf sayısının derin öğrenme yapıları üzerindeki etkisi araştırılmıştır. Ayrıca, farklı sayıda eğitim verileri kullanılarak ağın duyarlılığı değerlendirilmiştir. Ağların performansını değerlendirmek için Softmax ve Destek Vektör Makinesi olmak üzere iki sınıflandırıcı kullanılmıştır. Elde edilen sonuçlar dikkate alındığında % 95'in üzerinde sınıflama doğruluğuna ulaşıldığı görülmüştür.

Özet (Çeviri)

Voice recognition is the process by which the human voice is detected and recognized by the computer through a microphone. It has started to create an important place for itself in the developing technology process. In this study, deep learning methods were used to recognize previously recorded speech commands. In order to be processed in two-dimensional deep learning structures, audio data were converted to image by using spectogram method. Spectogram method is a sub-sampling technique based on fast fourier transform. Five different convolutional neural network models were created by using the spectogram technique and the trainings were performed with different data numbers. The data set is divided into different number of classes as separate categories. The effect of the number of classes on deep learning structures was investigated. Furthermore, the sensitivity of the network with different training data numbers was evaluated. In order to evaluate the performance of the networks, two classifiers were used as Softmax and Support Vector Machine. Over 95% accuracy was achieved.

Benzer Tezler

  1. Classification of abnormal respiratory sounds using deep learning techniques

    Solunum seslerinin derin öğrenme yöntemleri ile sınıflandırılması

    AHAMADI ABDALLAH IDRISSE

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgisayar Bilimleri Ana Bilim Dalı

    DOÇ. DR. OKTAY YILDIZ

  2. Öksürük ses kayıtları kullanılarak COVID-19 tahmini

    Predicting COVID-19 using cough audio recordings

    NURSEN KELEŞ

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAtatürk Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ METE YAĞANOĞLU

  3. Robust end-to-end synthetic speech detection with deep neural networks and masking

    Sağlam sonlu durumlu yapay konuşma algılama: Derin sinir ağları ve maskelerle güçlendirilmiş bütünsel yaklaşım

    BARIŞ AYDIN

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Elektrik ve Elektronik MühendisliğiAdana Alparslan Türkeş Bilim Ve Teknoloji Üniversitesi

    Elektrik ve Elektronik Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ GÖKAY DİŞKEN

  4. Detection of attention deficit hyperactivity disorder by using EEG signals and deep learning

    Dikkat eksikliği hiperaktivite bozukluğunun EEG sinyalleri ve derin öğrenmeyle tespiti

    EFE UTKU COŞMAZ

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Elektrik ve Elektronik Mühendisliğiİzmir Ekonomi Üniversitesi

    Elektrik ve Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. AYDIN AKAN

  5. Removing environmental factors of a recording with deconvolution technique and its potential uses

    Bir kaydın çevresel faktörlerinin ters evrişim yöntemiyle silinmesi ve bunun olası kullanım alanları

    MERT ALPERTEN

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Müzikİstanbul Teknik Üniversitesi

    Müzik Ana Bilim Dalı

    PROF. DR. SERTAÇ KAKI