Makine öğrenmesi yöntemleri ile ses tanıma uygulamaları
Sound recognition applications with machine learning methods
- Tez No: 742961
- Danışmanlar: DR. ÖĞR. ÜYESİ LEVENT BAYINDIR
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: Türkçe
- Üniversite: Atatürk Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
- Sayfa Sayısı: 77
Özet
Amaç: Gelişen teknoloji ile birlikte insan ve bilgisayar arasındaki iletişimi kolaylaştırmak amacıyla ses tanıma sistemlerine ihtiyaç duyulmaktadır. Günlük hayatta internet, cep telefonları, otomobil, ev vb. gibi birçok alanda ses tanıma sistemleri kullanılmaktadır. Bu nedenle ses tanıma sistemleri ile ilgili çalışmalar ilgi odağı olmuştur. Bu tez çalışmasında amaç, ses tanıma sistemleri ile ilgili uygulamalar yapılarak, çalışmada kullanılan veri kümelerindeki ses sinyallerinin makine öğrenmesi yöntemleri ile sınıflandırılmasının yapılmasıdır. İlk uygulamada bebek ağlama seslerinin sınıflandırılması, ikinci uygulamada ise elektrikli ev aletlerinin sınıflandırılması amaçlanmıştır. Yöntem: Ses tanıma sistemlerinin gerçekleştirilebilmesi için öncelikle veri kümelerinin oluşturulması gerekir. Çalışmada bebek ağlama sesleri veri kümeleri ve elektrikli ev aletlerinin seslerinden oluşan veri kümesi kullanılmıştır. Oluşturulan veri kümelerindeki ses sinyallerinin sınıflandırılabilmesi için Doğrusal Öngörülü Kepstrum Katsayıları (LPCC) ve Mel Frekans Kepstrum Katsayıları (MFCC) yöntemleri ile öznitelikleri çıkarılır. Son aşamada öznitelikleri çıkarılan ses sinyalleri k-En Yakın Komşuluk (k-NN), Çok Katmanlı Algılayıcı (MLP), Karar Ağacı (DT) ve Rastgele Orman (RF) makine öğrenmesi algoritmaları ile sınıflandırılır. Bulgular: Çalışmada ses sinyallerinin özniteliklerinin çıkarılması aşamasında, MFCC yönteminin LPCC yöntemine göre daha başarılı performans gösterdiği bulunmuştur. Ayrıca LPCC yönteminin daha küçük veri kümelerinde daha yüksek performans gösterdiği bulunmuştur. Öznitelikleri çıkarılan ses sinyallerinin sınıflandırılma aşamasında ise makine öğrenmesi algoritmaları karşılaştırılmıştır. Yapılan deneyler sonucunda MLP ve k-NN algoritmalarının diğer yöntemlere göre daha başarılı sonuçlar verdiği bulunmuştur. Sonuç: Yapılan çalışmalar sonucunda makine öğrenmesi yöntemlerinin ses tanıma sistemlerinde başarılı sonuçlar verdiği görülmektedir.
Özet (Çeviri)
Purpose: With the developing technology, sound recognition systems are needed in order to facilitate the communication between human and computer. Sound recognition systems are used in many areas such as the internet, mobile phones, automobiles, homes, etc. in daily life. For this reason, studies on sound recognition systems have been the focus of attention. The aim of this thesis is to develop applications related to sound recognition systems and to classify sound signals in data sets with machine learning methods. Method: In order to realize voice recognition systems, first of all, data sets must be created. In order to classify the audio signals in the generated data sets, their attributes are extracted using Linear Predictive Cepstral Coefficients (LPCC) and Mel Frequency Cepstral Coefficients (MFCC) methods. At the final stage, the features extracted audio signals are classified by k-Nearest Neighborhood (k-NN), Multi-Layer Perceptron (MLP), Decision Tree (DT) and Random Forest (RF) machine learning algorithms. Findings: In the study, it was found that the MFCC method performed better than the LPCC method in the extraction of features of the audio signals. It has also been found that the LPCC method performs better on smaller data sets. Machine learning algorithms were compared in the classification stage of the audio signals whose features were extracted. As a result of the experiments, it was found that MLP and k-NN algorithms produced more successful results than other methods. Result: As a result of the studies, it is seen that machine learning methods produce successful results in sound recognition systems.
Benzer Tezler
- Comparison of feature selection and extraction methods and active learning in voice based emotion recognition systems
Ses duygu tanıma sistemlerinde aktif öğrenme ve öznitelik seçme ve çıkarma yöntemlerinin karşılaştırılması
TOLGA ATALAY
Yüksek Lisans
İngilizce
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ YUSUF YASLAN
- Süne ve kımıl zararlılarının ses işleme yöntemleri ile sınıflandırılması ve bir gömülü sistem gerçeklemesi
Classification of sunn pests using sound processing methods and an embedded system realization
BİLGİ GÖRKEM YAZGAÇ
Yüksek Lisans
Türkçe
2017
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
DOÇ. DR. MÜRVET KIRCI
- Classification of abnormal respiratory sounds using deep learning techniques
Solunum seslerinin derin öğrenme yöntemleri ile sınıflandırılması
AHAMADI ABDALLAH IDRISSE
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilgisayar Bilimleri Ana Bilim Dalı
DOÇ. DR. OKTAY YILDIZ
- Emotion aware artificial intelligence for cognitive systems
Bilişsel sistemler için duygu farkındalıklı yapay zeka
DEĞER AYATA
Doktora
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. YUSUF YASLAN
PROF. DR. MUSTAFA ERSEL KAMAŞAK
- Improved fuzzy logic based edge detection method on clinical images
Klinik görüntülerde bulanık mantık temelli iyileştirilmiş kenar tespit yöntemi
MURAT MERT ÇELEN
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiKontrol ve Otomasyon Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ İLKER ÜSTOĞLU