Geri Dön

Konuşma olmayan sinyallerin evrişimsel sinir ağları tabanlı yaklaşımlar ile sınıflandırılması

Classification of non-speech signals with convolutional neural network based approaches

  1. Tez No: 632563
  2. Yazar: FATİH DEMİR
  3. Danışmanlar: PROF. DR. ABDULKADİR ŞENGÜR
  4. Tez Türü: Doktora
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2020
  8. Dil: Türkçe
  9. Üniversite: Fırat Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Teknolojileri Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 117

Özet

Makine öğrenmesi algoritmalarının gelişmesi ile birlikte her geçen sene değişik türdeki verilerin otomatik sınıflandırılması ve tanınması üzerine olan ilgi artmıştır. Bu ilgi alanları arasında yer alan konuşma olmayan sesler ve biyomedikal işaretlerin, arka plan sesi ve gürültüden dolayı sınıflandırılması zordur. Literatürde, bu tür sınıflandırma problemleri genellikle, akustik öznitelikler ve geleneksel sınıflandırma algoritmaları kullanan yöntemler ile aşılmaya çalışılmıştır. Bu çalışmada, konuşma olmayan seslerin ve biyomedikal işaretlerin sınıflandırma problemi, son zamanlarda popüler hale gelen ve derin öğrenmenin alt alanı olan Evrişimsel Sinir Ağları (ESA) temelli yaklaşımlar ile çözülmeye çalışılmıştır. Bu kapsamda akciğer sesleri, kalp sesleri, EMG sinyalleri ve çevresel sesleri içeren kullanıma açık veri setleri üzerinde deneysel çalışmalar yapılmıştır. Önerilen yöntemlerde, genel olarak derin öznitelikler tabanlı ve transfer öğrenme tabanlı yaklaşımlarla çalışmalar yapılmıştır. Derin öznitelikler tabanlı yaklaşımın, transfer öğrenme tabanlı yaklaşıma ve aynı veri setini kullanan diğer geleneksel yöntemlere göre daha iyi bir sınıflandırma performansı verdiği görülmüştür. Ayrıca tezin son bölümünde, derin öznitelikler çıkarmak için büyük görüntü verileriyle eğitilmiş ESA modelleri kullanmak yerine çevresel sesler ile eğitilmiş olan ve mimarisi kullanıcı tarafından ayarlanabilen bir ESA modeli önerilmiştir. Bu modelin çevresel sesleri sınıflandırmada, hem önceden eğitilmiş ESA modelleriyle derin öznitelik çıkarma yaklaşımına hem de aynı veri setini kullanan diğer yöntemlere göre daha iyi sınıflandırma performansı verdiği görülmüştür.

Özet (Çeviri)

The interest on auto-classification and recognition of different types of data, has increased with development of machine-learning algorithms every passing year. The classification of non-speech sounds and biomedical signals taking part at these interest fields are difficult because of background sound and noise. In the literature, such classification problems are generally tried to be overcome by methods using acoustic features and traditional classification algorithms In this study, the classification problem of non-speech sounds and biomedical signals are tackled with Convolutional Neural Networks (CNN) based approaches, which have become popular recently and are a subfield of deep learning. In this context, the experimental studies are realized on public datasets including lung sounds, heart sounds, EMG signals and environmental sounds. In the proposed methods, studies are generally conducted with deep features based and transfer learning based approaches. It is shown that deep feature-based approaches give better the classification performance than the transfer learning-based approaches and the other conventional methods using same dataset. Besides, at the last part of the thesis, an CNN model whose architecture can be arranged by user and trained with environmental sounds, is proposed to extract deep features instead of using CNN models, which is pre-trained with big image data. It is concluded that this model presents better classification performance than deep feature extraction approach with pre-trained CNN models and other methods using same dataset for the classification of environmental sounds.

Benzer Tezler

  1. Derin öğrenme ile ses iyileştirilmesi

    Voice enhancement by deep learning

    MUSTAFA ERSEVEN

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    Elektrik ve Elektronik MühendisliğiYıldız Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ BÜLENT BOLAT

  2. CNN tabanlı modeller kullanılarak sinyal gürültü bastırma ve frekans seçici filtrelemenin modellenmesi, uygulaması ve harmonik tabanlı performans degerlendirilmesi

    The modeling, application and harmonic-based performance evaluation of signal denoising and frequency-selective filtering by using CNN-based models

    OMAR NAJAR

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Elektrik ve Elektronik MühendisliğiSüleyman Demirel Üniversitesi

    Elektrik ve Elektronik Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ TURGAY KOÇ

  3. New approaches for speech enhancement with wavelet transform

    Dalgacık dönüşümü ile konuşma iyileştirme için yeni yaklaşımlar

    ELİF ÖZEN

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilim ve TeknolojiYaşar Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ NALAN ÖZKURT

  4. Durağan olmayan sinyallerin senkro sıkıştırma ve görgül kip ayrışım yöntemleri ile analizi

    Analysis of non-stationary signals by synchrosqueezing and empirical mode decomposition methods

    ALİ KARACA

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Elektrik ve Elektronik Mühendisliğiİstanbul Üniversitesi-Cerrahpaşa

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MAHMUT ÖZTÜRK

    PROF. DR. AYDIN AKAN

  5. Saklı Markov modellerinde üç temel problemin incelenmesi

    Investigation of three basic problems in hidden Markov models

    ZÜLEYHA SEMERCİ

    Yüksek Lisans

    Türkçe

    Türkçe

    2006

    İstatistikHacettepe Üniversitesi

    İstatistik Ana Bilim Dalı

    DOÇ. DR. GÜL ERGÜN