Konuşma olmayan sinyallerin evrişimsel sinir ağları tabanlı yaklaşımlar ile sınıflandırılması

Classification of non-speech signals with convolutional neural network based approaches

PDF İndir

Tez No: 632563
Yazar: FATİH DEMİR
Danışmanlar: PROF. DR. ABDULKADİR ŞENGÜR
Tez Türü: Doktora
Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
Anahtar Kelimeler: Belirtilmemiş.
Yıl: 2020
Dil: Türkçe
Üniversite: Fırat Üniversitesi
Enstitü: Fen Bilimleri Enstitüsü
Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Teknolojileri Ana Bilim Dalı
Bilim Dalı: Belirtilmemiş.
Sayfa Sayısı: 117

Özet

Makine öğrenmesi algoritmalarının gelişmesi ile birlikte her geçen sene değişik türdeki verilerin otomatik sınıflandırılması ve tanınması üzerine olan ilgi artmıştır. Bu ilgi alanları arasında yer alan konuşma olmayan sesler ve biyomedikal işaretlerin, arka plan sesi ve gürültüden dolayı sınıflandırılması zordur. Literatürde, bu tür sınıflandırma problemleri genellikle, akustik öznitelikler ve geleneksel sınıflandırma algoritmaları kullanan yöntemler ile aşılmaya çalışılmıştır. Bu çalışmada, konuşma olmayan seslerin ve biyomedikal işaretlerin sınıflandırma problemi, son zamanlarda popüler hale gelen ve derin öğrenmenin alt alanı olan Evrişimsel Sinir Ağları (ESA) temelli yaklaşımlar ile çözülmeye çalışılmıştır. Bu kapsamda akciğer sesleri, kalp sesleri, EMG sinyalleri ve çevresel sesleri içeren kullanıma açık veri setleri üzerinde deneysel çalışmalar yapılmıştır. Önerilen yöntemlerde, genel olarak derin öznitelikler tabanlı ve transfer öğrenme tabanlı yaklaşımlarla çalışmalar yapılmıştır. Derin öznitelikler tabanlı yaklaşımın, transfer öğrenme tabanlı yaklaşıma ve aynı veri setini kullanan diğer geleneksel yöntemlere göre daha iyi bir sınıflandırma performansı verdiği görülmüştür. Ayrıca tezin son bölümünde, derin öznitelikler çıkarmak için büyük görüntü verileriyle eğitilmiş ESA modelleri kullanmak yerine çevresel sesler ile eğitilmiş olan ve mimarisi kullanıcı tarafından ayarlanabilen bir ESA modeli önerilmiştir. Bu modelin çevresel sesleri sınıflandırmada, hem önceden eğitilmiş ESA modelleriyle derin öznitelik çıkarma yaklaşımına hem de aynı veri setini kullanan diğer yöntemlere göre daha iyi sınıflandırma performansı verdiği görülmüştür.

Özet (Çeviri)

The interest on auto-classification and recognition of different types of data, has increased with development of machine-learning algorithms every passing year. The classification of non-speech sounds and biomedical signals taking part at these interest fields are difficult because of background sound and noise. In the literature, such classification problems are generally tried to be overcome by methods using acoustic features and traditional classification algorithms In this study, the classification problem of non-speech sounds and biomedical signals are tackled with Convolutional Neural Networks (CNN) based approaches, which have become popular recently and are a subfield of deep learning. In this context, the experimental studies are realized on public datasets including lung sounds, heart sounds, EMG signals and environmental sounds. In the proposed methods, studies are generally conducted with deep features based and transfer learning based approaches. It is shown that deep feature-based approaches give better the classification performance than the transfer learning-based approaches and the other conventional methods using same dataset. Besides, at the last part of the thesis, an CNN model whose architecture can be arranged by user and trained with environmental sounds, is proposed to extract deep features instead of using CNN models, which is pre-trained with big image data. It is concluded that this model presents better classification performance than deep feature extraction approach with pre-trained CNN models and other methods using same dataset for the classification of environmental sounds.

Benzer Tezler

Tez No
540691
Derin öğrenme ile ses iyileştirilmesi
Voice enhancement by deep learning
MUSTAFA ERSEVEN
Yüksek Lisans
Türkçe
2018
Elektrik ve Elektronik Mühendisliği Yıldız Teknik Üniversitesi
Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ BÜLENT BOLAT
Tez No
747364
CNN tabanlı modeller kullanılarak sinyal gürültü bastırma ve frekans seçici filtrelemenin modellenmesi, uygulaması ve harmonik tabanlı performans degerlendirilmesi
The modeling, application and harmonic-based performance evaluation of signal denoising and frequency-selective filtering by using CNN-based models
OMAR NAJAR
Yüksek Lisans
Türkçe
2022
Elektrik ve Elektronik Mühendisliği Süleyman Demirel Üniversitesi
Elektrik ve Elektronik Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ TURGAY KOÇ
Tez No
712237
New approaches for speech enhancement with wavelet transform
Dalgacık dönüşümü ile konuşma iyileştirme için yeni yaklaşımlar
ELİF ÖZEN
Yüksek Lisans
İngilizce
2022
Bilim ve Teknoloji Yaşar Üniversitesi
Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ NALAN ÖZKURT
Tez No
578894
Durağan olmayan sinyallerin senkro sıkıştırma ve görgül kip ayrışım yöntemleri ile analizi
Analysis of non-stationary signals by synchrosqueezing and empirical mode decomposition methods
ALİ KARACA
Yüksek Lisans
Türkçe
2019
Elektrik ve Elektronik Mühendisliği İstanbul Üniversitesi-Cerrahpaşa
Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ MAHMUT ÖZTÜRK
PROF. DR. AYDIN AKAN
Tez No
182355
Saklı Markov modellerinde üç temel problemin incelenmesi
Investigation of three basic problems in hidden Markov models
ZÜLEYHA SEMERCİ
Yüksek Lisans
Türkçe
2006
İstatistik Hacettepe Üniversitesi
İstatistik Ana Bilim Dalı
DOÇ. DR. GÜL ERGÜN

Geri Dön