Geri Dön

Audio detection using machine learning & transfer learning models

Makine öğrenmesi ve transfer öğrenimi kullanılarak ses tanıma

  1. Tez No: 704061
  2. Yazar: MESUT ACAR
  3. Danışmanlar: PROF. DR. HASAN DAĞ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Bilim ve Teknoloji, Computer Engineering and Computer Science and Control, Science and Technology
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2021
  8. Dil: İngilizce
  9. Üniversite: Kadir Has Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Yönetim Bilişim Sistemleri Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 39

Özet

Bu çalışmada çevre seslerinden oluşan ESC-50 ve ESC-10 veri seti, çeşitli makine öğrenmesi, transfer öğrenme altyapısı ve farklı öznitelik çıkarımı yöntemleri kullanarak sınıflandırma çalışmaları yapılmıştır. K-NN, SVM, Rastgele Orman makine öğrenimi algoritmaları kullanılmıştır. Farklı öznitelik çıkarım algoritmaları kullanılarak, bu veri seti için makine öğrenmesi algoritmalarında farklı sonuçlar elde edilmiştir. Bu yaklaşımda SVM algoritmasın gözle görülür bir şekilde performansının attığı gözlemlenmiştir. Klasik makine öğrenmesi algoritmaları ile elde edilen en iyi doğruluk puanları ESC-50 için %42,15 ve ESC-10 için %77,7'dir. Buna ek olarak, makine öğrenmesi modellerinden daha başarılı sonuçlar elde eden, omurga olarak önceden eğitilmiş bir ResNet sinir ağı ile deneyler yapılmıştır. Yapılan deneylerde, literatürdeki temel makine öğrenmesi algoritmalarından ve literatürdeki iyi sonuçlara ulaşmak için önceden eğitilmiş Resnet omurgaları ile transfer öğrenmesi kullanılarak daha yüksek bir doğruluk oranı elde edilmiştir. Resnet algoritması ile ESC-50 için %68,95, ESC-10 için ise %87,25 doğruluk oranı elde edilmiştir.

Özet (Çeviri)

In this paper, using datasets ESC-50 & ESC-10 of environmental sounds, machine learning algorithms, and feature extraction methods are used to develop recognition performance. K-NN, SVM, Random Forest are used for comparing the recognition results. The different feature extraction methods in the literature are used to get more meaningful attributes from these datasets and obtain a higher accuracy rate. This approach shows that SVM algorithm has a significantly good result with accuracy scores. The best accuracy scores obtained by classic machine learning algorithms are %42,15 for ESC-50 and %77,7 for ESC-10. In addition to this, the experiments have been done with a pre-trained ResNet neural network as a backbone, which achieves successful results despite the machine learning models. In this study, a higher accuracy rate is achieved from baseline machine learning algorithms in literature and using transfer learning with pre-trained Resnet backbones to reach some state of art results. The accuracy scores are %68,95 for ESC-50 and %87,25 for ESC-10.

Benzer Tezler

  1. Sound based location detection using machine learning methods

    Makine öğrenmesi yöntemleri kullanarak ses tabanlı konum tespiti

    NURA ABDULLAHI

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Adli TıpFırat Üniversitesi

    Adli Bilişim Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ERHAN AKBAL

  2. Audıo deep fake detectıon usıng deep learnıng

    Derin öğrenme kullanarak ses derin sahtekarı algılama

    OUSAMA A SHAABAN

    Doktora

    İngilizce

    İngilizce

    2025

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAnkara Yıldırım Beyazıt Üniversitesi

    Bilgisayar Mühendisliği ve Enformatik Bilimler Ana Bilim Dalı

    Prof. Dr. REMZİ YILDIRIM

  3. Makine öğrenmesi teknikleri kullanılarak Parkinson hastalığı tespiti ve sınıflandırılması

    Detection and classification of Parkinson's disease using machine learning techniques

    SERAP BEĞDAŞ

    Yüksek Lisans

    Türkçe

    Türkçe

    2025

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSivas Cumhuriyet Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. HİDAYET TAKCI

  4. Makine öğrenmesi yöntemleriyle Türkçe'deki farklı aksanların sınıflandırılması

    Classification of different accents in Turkish using machine learning methods

    SÜMEYRA BAŞ

    Yüksek Lisans

    Türkçe

    Türkçe

    2025

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKocaeli Üniversitesi

    Yazılım Mühendisliği Ana Bilim Dalı

    DOÇ. DR. HAKAN GÜNDÜZ

  5. Parkinson's disease detection using deep learning based on voice recording

    Derin öğrenme ile ses kaydına dayalı Parkinson hastalığı tespiti

    SAJA MURTADHA HASHIM AL-GBURI

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKarabük Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. HAKAN KUTUCU