Geri Dön

Audio detection using machine learning & transfer learning models

Makine öğrenmesi ve transfer öğrenimi kullanılarak ses tanıma

  1. Tez No: 704061
  2. Yazar: MESUT ACAR
  3. Danışmanlar: PROF. DR. HASAN DAĞ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Bilim ve Teknoloji, Computer Engineering and Computer Science and Control, Science and Technology
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2021
  8. Dil: İngilizce
  9. Üniversite: Kadir Has Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Yönetim Bilişim Sistemleri Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 39

Özet

Bu çalışmada çevre seslerinden oluşan ESC-50 ve ESC-10 veri seti, çeşitli makine öğrenmesi, transfer öğrenme altyapısı ve farklı öznitelik çıkarımı yöntemleri kullanarak sınıflandırma çalışmaları yapılmıştır. K-NN, SVM, Rastgele Orman makine öğrenimi algoritmaları kullanılmıştır. Farklı öznitelik çıkarım algoritmaları kullanılarak, bu veri seti için makine öğrenmesi algoritmalarında farklı sonuçlar elde edilmiştir. Bu yaklaşımda SVM algoritmasın gözle görülür bir şekilde performansının attığı gözlemlenmiştir. Klasik makine öğrenmesi algoritmaları ile elde edilen en iyi doğruluk puanları ESC-50 için %42,15 ve ESC-10 için %77,7'dir. Buna ek olarak, makine öğrenmesi modellerinden daha başarılı sonuçlar elde eden, omurga olarak önceden eğitilmiş bir ResNet sinir ağı ile deneyler yapılmıştır. Yapılan deneylerde, literatürdeki temel makine öğrenmesi algoritmalarından ve literatürdeki iyi sonuçlara ulaşmak için önceden eğitilmiş Resnet omurgaları ile transfer öğrenmesi kullanılarak daha yüksek bir doğruluk oranı elde edilmiştir. Resnet algoritması ile ESC-50 için %68,95, ESC-10 için ise %87,25 doğruluk oranı elde edilmiştir.

Özet (Çeviri)

In this paper, using datasets ESC-50 & ESC-10 of environmental sounds, machine learning algorithms, and feature extraction methods are used to develop recognition performance. K-NN, SVM, Random Forest are used for comparing the recognition results. The different feature extraction methods in the literature are used to get more meaningful attributes from these datasets and obtain a higher accuracy rate. This approach shows that SVM algorithm has a significantly good result with accuracy scores. The best accuracy scores obtained by classic machine learning algorithms are %42,15 for ESC-50 and %77,7 for ESC-10. In addition to this, the experiments have been done with a pre-trained ResNet neural network as a backbone, which achieves successful results despite the machine learning models. In this study, a higher accuracy rate is achieved from baseline machine learning algorithms in literature and using transfer learning with pre-trained Resnet backbones to reach some state of art results. The accuracy scores are %68,95 for ESC-50 and %87,25 for ESC-10.

Benzer Tezler

  1. Sound based location detection using machine learning methods

    Makine öğrenmesi yöntemleri kullanarak ses tabanlı konum tespiti

    NURA ABDULLAHI

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Adli TıpFırat Üniversitesi

    Adli Bilişim Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ERHAN AKBAL

  2. Makine öğrenmesi algoritmaları kullanılarak disfonik seslerin incelenmesi

    Investigation of dysphonic sounds using machine learning algorithms

    PERVİN KILINÇ

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Elektrik ve Elektronik MühendisliğiErciyes Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    PROF. MUSTAFA ALÇI

  3. Parkinson's disease detection using deep learning based on voice recording

    Derin öğrenme ile ses kaydına dayalı Parkinson hastalığı tespiti

    SAJA MURTADHA HASHIM AL-GBURI

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKarabük Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. HAKAN KUTUCU

  4. Ses sinyalleri kullanılarak talaşlı imalat prosesinde takım durumunun izlenmesi

    Tool condition monitoring using sound signal in machining process

    EMRE KALKANLI

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    Mekatronik MühendisliğiBursa Teknik Üniversitesi

    Mekatronik Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ CELALETTİN YÜCE

  5. Dyslexia detection in children using audio records

    Ses kayıtlarını kullanarak çocuklarda disleksi tespiti

    TUĞBERK TAŞ

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAnkara Yıldırım Beyazıt Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. MUHAMMED ABDULLAH BÜLBÜL

    DR. ÖĞR. ÜYESİ MÜCAHİD KUTLU