Konuşma olmayan sinyallerin evrişimsel sinir ağları tabanlı yaklaşımlar ile sınıflandırılması
Classification of non-speech signals with convolutional neural network based approaches
- Tez No: 632563
- Danışmanlar: PROF. DR. ABDULKADİR ŞENGÜR
- Tez Türü: Doktora
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2020
- Dil: Türkçe
- Üniversite: Fırat Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Teknolojileri Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 117
Özet
Makine öğrenmesi algoritmalarının gelişmesi ile birlikte her geçen sene değişik türdeki verilerin otomatik sınıflandırılması ve tanınması üzerine olan ilgi artmıştır. Bu ilgi alanları arasında yer alan konuşma olmayan sesler ve biyomedikal işaretlerin, arka plan sesi ve gürültüden dolayı sınıflandırılması zordur. Literatürde, bu tür sınıflandırma problemleri genellikle, akustik öznitelikler ve geleneksel sınıflandırma algoritmaları kullanan yöntemler ile aşılmaya çalışılmıştır. Bu çalışmada, konuşma olmayan seslerin ve biyomedikal işaretlerin sınıflandırma problemi, son zamanlarda popüler hale gelen ve derin öğrenmenin alt alanı olan Evrişimsel Sinir Ağları (ESA) temelli yaklaşımlar ile çözülmeye çalışılmıştır. Bu kapsamda akciğer sesleri, kalp sesleri, EMG sinyalleri ve çevresel sesleri içeren kullanıma açık veri setleri üzerinde deneysel çalışmalar yapılmıştır. Önerilen yöntemlerde, genel olarak derin öznitelikler tabanlı ve transfer öğrenme tabanlı yaklaşımlarla çalışmalar yapılmıştır. Derin öznitelikler tabanlı yaklaşımın, transfer öğrenme tabanlı yaklaşıma ve aynı veri setini kullanan diğer geleneksel yöntemlere göre daha iyi bir sınıflandırma performansı verdiği görülmüştür. Ayrıca tezin son bölümünde, derin öznitelikler çıkarmak için büyük görüntü verileriyle eğitilmiş ESA modelleri kullanmak yerine çevresel sesler ile eğitilmiş olan ve mimarisi kullanıcı tarafından ayarlanabilen bir ESA modeli önerilmiştir. Bu modelin çevresel sesleri sınıflandırmada, hem önceden eğitilmiş ESA modelleriyle derin öznitelik çıkarma yaklaşımına hem de aynı veri setini kullanan diğer yöntemlere göre daha iyi sınıflandırma performansı verdiği görülmüştür.
Özet (Çeviri)
The interest on auto-classification and recognition of different types of data, has increased with development of machine-learning algorithms every passing year. The classification of non-speech sounds and biomedical signals taking part at these interest fields are difficult because of background sound and noise. In the literature, such classification problems are generally tried to be overcome by methods using acoustic features and traditional classification algorithms In this study, the classification problem of non-speech sounds and biomedical signals are tackled with Convolutional Neural Networks (CNN) based approaches, which have become popular recently and are a subfield of deep learning. In this context, the experimental studies are realized on public datasets including lung sounds, heart sounds, EMG signals and environmental sounds. In the proposed methods, studies are generally conducted with deep features based and transfer learning based approaches. It is shown that deep feature-based approaches give better the classification performance than the transfer learning-based approaches and the other conventional methods using same dataset. Besides, at the last part of the thesis, an CNN model whose architecture can be arranged by user and trained with environmental sounds, is proposed to extract deep features instead of using CNN models, which is pre-trained with big image data. It is concluded that this model presents better classification performance than deep feature extraction approach with pre-trained CNN models and other methods using same dataset for the classification of environmental sounds.
Benzer Tezler
- Derin öğrenme ile ses iyileştirilmesi
Voice enhancement by deep learning
MUSTAFA ERSEVEN
Yüksek Lisans
Türkçe
2018
Elektrik ve Elektronik MühendisliğiYıldız Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ BÜLENT BOLAT
- CNN tabanlı modeller kullanılarak sinyal gürültü bastırma ve frekans seçici filtrelemenin modellenmesi, uygulaması ve harmonik tabanlı performans degerlendirilmesi
The modeling, application and harmonic-based performance evaluation of signal denoising and frequency-selective filtering by using CNN-based models
OMAR NAJAR
Yüksek Lisans
Türkçe
2022
Elektrik ve Elektronik MühendisliğiSüleyman Demirel ÜniversitesiElektrik ve Elektronik Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ TURGAY KOÇ
- New approaches for speech enhancement with wavelet transform
Dalgacık dönüşümü ile konuşma iyileştirme için yeni yaklaşımlar
ELİF ÖZEN
Yüksek Lisans
İngilizce
2022
Bilim ve TeknolojiYaşar ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ NALAN ÖZKURT
- Durağan olmayan sinyallerin senkro sıkıştırma ve görgül kip ayrışım yöntemleri ile analizi
Analysis of non-stationary signals by synchrosqueezing and empirical mode decomposition methods
ALİ KARACA
Yüksek Lisans
Türkçe
2019
Elektrik ve Elektronik Mühendisliğiİstanbul Üniversitesi-CerrahpaşaElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ MAHMUT ÖZTÜRK
PROF. DR. AYDIN AKAN
- Saklı Markov modellerinde üç temel problemin incelenmesi
Investigation of three basic problems in hidden Markov models
ZÜLEYHA SEMERCİ