Makine öğrenmesi yöntemleri ile ses tanıma uygulamaları

Sound recognition applications with machine learning methods

PDF İndir

Tez No: 742961
Yazar: BENGİSU ŞEYDA KOP
Danışmanlar: DR. ÖĞR. ÜYESİ LEVENT BAYINDIR
Tez Türü: Yüksek Lisans
Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
Anahtar Kelimeler: Belirtilmemiş.
Yıl: 2022
Dil: Türkçe
Üniversite: Atatürk Üniversitesi
Enstitü: Fen Bilimleri Enstitüsü
Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
Sayfa Sayısı: 77

Özet

Amaç: Gelişen teknoloji ile birlikte insan ve bilgisayar arasındaki iletişimi kolaylaştırmak amacıyla ses tanıma sistemlerine ihtiyaç duyulmaktadır. Günlük hayatta internet, cep telefonları, otomobil, ev vb. gibi birçok alanda ses tanıma sistemleri kullanılmaktadır. Bu nedenle ses tanıma sistemleri ile ilgili çalışmalar ilgi odağı olmuştur. Bu tez çalışmasında amaç, ses tanıma sistemleri ile ilgili uygulamalar yapılarak, çalışmada kullanılan veri kümelerindeki ses sinyallerinin makine öğrenmesi yöntemleri ile sınıflandırılmasının yapılmasıdır. İlk uygulamada bebek ağlama seslerinin sınıflandırılması, ikinci uygulamada ise elektrikli ev aletlerinin sınıflandırılması amaçlanmıştır. Yöntem: Ses tanıma sistemlerinin gerçekleştirilebilmesi için öncelikle veri kümelerinin oluşturulması gerekir. Çalışmada bebek ağlama sesleri veri kümeleri ve elektrikli ev aletlerinin seslerinden oluşan veri kümesi kullanılmıştır. Oluşturulan veri kümelerindeki ses sinyallerinin sınıflandırılabilmesi için Doğrusal Öngörülü Kepstrum Katsayıları (LPCC) ve Mel Frekans Kepstrum Katsayıları (MFCC) yöntemleri ile öznitelikleri çıkarılır. Son aşamada öznitelikleri çıkarılan ses sinyalleri k-En Yakın Komşuluk (k-NN), Çok Katmanlı Algılayıcı (MLP), Karar Ağacı (DT) ve Rastgele Orman (RF) makine öğrenmesi algoritmaları ile sınıflandırılır. Bulgular: Çalışmada ses sinyallerinin özniteliklerinin çıkarılması aşamasında, MFCC yönteminin LPCC yöntemine göre daha başarılı performans gösterdiği bulunmuştur. Ayrıca LPCC yönteminin daha küçük veri kümelerinde daha yüksek performans gösterdiği bulunmuştur. Öznitelikleri çıkarılan ses sinyallerinin sınıflandırılma aşamasında ise makine öğrenmesi algoritmaları karşılaştırılmıştır. Yapılan deneyler sonucunda MLP ve k-NN algoritmalarının diğer yöntemlere göre daha başarılı sonuçlar verdiği bulunmuştur. Sonuç: Yapılan çalışmalar sonucunda makine öğrenmesi yöntemlerinin ses tanıma sistemlerinde başarılı sonuçlar verdiği görülmektedir.

Özet (Çeviri)

Purpose: With the developing technology, sound recognition systems are needed in order to facilitate the communication between human and computer. Sound recognition systems are used in many areas such as the internet, mobile phones, automobiles, homes, etc. in daily life. For this reason, studies on sound recognition systems have been the focus of attention. The aim of this thesis is to develop applications related to sound recognition systems and to classify sound signals in data sets with machine learning methods. Method: In order to realize voice recognition systems, first of all, data sets must be created. In order to classify the audio signals in the generated data sets, their attributes are extracted using Linear Predictive Cepstral Coefficients (LPCC) and Mel Frequency Cepstral Coefficients (MFCC) methods. At the final stage, the features extracted audio signals are classified by k-Nearest Neighborhood (k-NN), Multi-Layer Perceptron (MLP), Decision Tree (DT) and Random Forest (RF) machine learning algorithms. Findings: In the study, it was found that the MFCC method performed better than the LPCC method in the extraction of features of the audio signals. It has also been found that the LPCC method performs better on smaller data sets. Machine learning algorithms were compared in the classification stage of the audio signals whose features were extracted. As a result of the experiments, it was found that MLP and k-NN algorithms produced more successful results than other methods. Result: As a result of the studies, it is seen that machine learning methods produce successful results in sound recognition systems.

Benzer Tezler

Tez No
511691
Comparison of feature selection and extraction methods and active learning in voice based emotion recognition systems
Ses duygu tanıma sistemlerinde aktif öğrenme ve öznitelik seçme ve çıkarma yöntemlerinin karşılaştırılması
TOLGA ATALAY
Yüksek Lisans
İngilizce
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol İstanbul Teknik Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ YUSUF YASLAN
Tez No
455400
Süne ve kımıl zararlılarının ses işleme yöntemleri ile sınıflandırılması ve bir gömülü sistem gerçeklemesi
Classification of sunn pests using sound processing methods and an embedded system realization
BİLGİ GÖRKEM YAZGAÇ
Yüksek Lisans
Türkçe
2017
Elektrik ve Elektronik Mühendisliği İstanbul Teknik Üniversitesi
Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
DOÇ. DR. MÜRVET KIRCI
Tez No
827867
Classification of abnormal respiratory sounds using deep learning techniques
Solunum seslerinin derin öğrenme yöntemleri ile sınıflandırılması
AHAMADI ABDALLAH IDRISSE
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Gazi Üniversitesi
Bilgisayar Bilimleri Ana Bilim Dalı
DOÇ. DR. OKTAY YILDIZ
Tez No
546544
Emotion aware artificial intelligence for cognitive systems
Bilişsel sistemler için duygu farkındalıklı yapay zeka
DEĞER AYATA
Doktora
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol İstanbul Teknik Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. YUSUF YASLAN
PROF. DR. MUSTAFA ERSEL KAMAŞAK
Tez No
706845
Improved fuzzy logic based edge detection method on clinical images
Klinik görüntülerde bulanık mantık temelli iyileştirilmiş kenar tespit yöntemi
MURAT MERT ÇELEN
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol İstanbul Teknik Üniversitesi
Kontrol ve Otomasyon Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ İLKER ÜSTOĞLU

Geri Dön