Geri Dön

Audio classification based on machine learning: Understanding animal behavior through sound

Makine öğrenimine dayalı ses sınıflandırması: Hayvan davranışını ses yoluyla anlamak

  1. Tez No: 830664
  2. Yazar: FURKAN YAZ
  3. Danışmanlar: PROF. DR. CEYLAN YOZGATLIGİL
  4. Tez Türü: Yüksek Lisans
  5. Konular: İstatistik, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 61

Özet

Her geçen gün hayatımızı kolaylaştırmaya çalışan makine öğrenmesi temelli ürünler artmaktadır. Bu ürünler arkalarında çalışan makine öğrenmesi modelleri sayesinde görebilir veya duyabilir hale gelerek bulunduğu bağlam hakkında bilgi sağlarlar. Bu çalışmada da buna hizmet etmesi amacıyla kedi seslerini duyup anlayabilen üç makine öğrenmesi yöntemi geliştirildi. Bu modeller Yapay Sinir Ağları, Evrişimli Sinir Ağları ve CatBoost. 6 farklı kedi davranışını anlayabilmek için iki bin seslik bir veri kütüphanesi oluşturuldu. Süreç ön işleme, özellik çıkarma ve sınıflandırma olmak üzere üç temel adımda ilerlemiştir. Ses özelliği çıkarma için en yaygın kullanılan özellik çıkarma algoritmalarından birisi olan Mel-Frequency Cepstral Coefficients (MFCCs) tercih edilmiştir. Değerlendirme metriği olarak doğruluk kullanılmıştır. Modellerin hepsinde minimum %95 sınıflandırma başarı oranına ulaşılmış ve en başarılı olan model Evrişimli Sinir Ağları olarak tespit edilmiştir. Buna gerekçe olarak ise model mimarisinde evrişimli ve havuz katmanlarının varlığı olarak düşünülmüştür.

Özet (Çeviri)

Machine learning-based products that try to make our lives easier are increasing day by day. Thanks to the machine learning models running behind them, these products can be seen or heard and provide information about the context they are in. In this study, three machine learning methods that can hear and understand cat sounds were developed to serve this purpose. These models are Artificial Neural Network, Convolutional Neural Network, and CatBoost. A data library of two thousand sounds was created to understand 6 different cat behaviors. The process proceeded in three basic steps: pre-processing, feature extraction, and classification. One of the most widely used feature extraction algorithms, Mel-Frequency Cepstral Coefficients (MFCCs) has been preferred for Audio Feature Extraction. Accuracy was used as the evaluation metric. A minimum classification success rate of 95% was achieved in all models and the most successful model was determined as Convolutional Neural Network. The reason for this is considered as the presence of convolutional and pooling layers in the model architecture.

Benzer Tezler

  1. Audio based classification over musical production period: A study on musics of Barış Manço and his contemporaries

    Müzik prodüksiyon dönemi üzerine ses tabanlı sınıflandırma: Barış Manço ve çağdaşlarının müzikleri üzerine bir çalışma

    METEHAN KÖKTÜRK

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Müzikİstanbul Teknik Üniversitesi

    Müzik Ana Bilim Dalı

    PROF. DR. CAN KARADOĞAN

  2. Context aware audio-visual environment awareness using convolutional neural network

    Konvolüsyonel sinir ağı kullarak ses ve görüntü aracılığıyla ortam farkındalığı

    GİRAY YILLIKÇI

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    İletişim Sistemleri Ana Bilim Dalı

    PROF. DR. İBRAHİM AKDUMAN

  3. Perküsyon ve makine öğrenim yöntemleri kullanılarak beton nem seviyesini takibi

    Moisture tracking of concrete using percussion and machine learning methods

    ZEKİYE ŞEYMA TAMAY

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Elektrik ve Elektronik MühendisliğiSivas Cumhuriyet Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DR. YAVUZ TÜRKAY

  4. An approach based on sound classification to predict soundscape perception through machine learning

    Makine öğrenimi yoluyla işitsel peyzaj algısnın tahmini için ses sınıflandırmasına dayalı bir yaklaşım

    VOLKAN ACUN

    Doktora

    İngilizce

    İngilizce

    2021

    İç Mimari ve Dekorasyonİhsan Doğramacı Bilkent Üniversitesi

    İç Mimarlık ve Çevre Tasarımı Ana Bilim Dalı

    DOÇ. DR. SEMİHA YILMAZER

  5. Sparse coding based ensemble classifiers combined with active learning framework for data classification

    Veri sınıflandırma için aktif öğrenme çerçevesi ile birleştirilmiş ayrık kodlama tabanlı sınıflandırıcı toplulukları

    GÖKSU TÜYSÜZOĞLU

    Yüksek Lisans

    İngilizce

    İngilizce

    2016

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. YUSUF YASLAN