Audio classification based on machine learning: Understanding animal behavior through sound
Makine öğrenimine dayalı ses sınıflandırması: Hayvan davranışını ses yoluyla anlamak
- Tez No: 830664
- Danışmanlar: PROF. DR. CEYLAN YOZGATLIGİL
- Tez Türü: Yüksek Lisans
- Konular: İstatistik, Statistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: İstatistik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 61
Özet
Her geçen gün hayatımızı kolaylaştırmaya çalışan makine öğrenmesi temelli ürünler artmaktadır. Bu ürünler arkalarında çalışan makine öğrenmesi modelleri sayesinde görebilir veya duyabilir hale gelerek bulunduğu bağlam hakkında bilgi sağlarlar. Bu çalışmada da buna hizmet etmesi amacıyla kedi seslerini duyup anlayabilen üç makine öğrenmesi yöntemi geliştirildi. Bu modeller Yapay Sinir Ağları, Evrişimli Sinir Ağları ve CatBoost. 6 farklı kedi davranışını anlayabilmek için iki bin seslik bir veri kütüphanesi oluşturuldu. Süreç ön işleme, özellik çıkarma ve sınıflandırma olmak üzere üç temel adımda ilerlemiştir. Ses özelliği çıkarma için en yaygın kullanılan özellik çıkarma algoritmalarından birisi olan Mel-Frequency Cepstral Coefficients (MFCCs) tercih edilmiştir. Değerlendirme metriği olarak doğruluk kullanılmıştır. Modellerin hepsinde minimum %95 sınıflandırma başarı oranına ulaşılmış ve en başarılı olan model Evrişimli Sinir Ağları olarak tespit edilmiştir. Buna gerekçe olarak ise model mimarisinde evrişimli ve havuz katmanlarının varlığı olarak düşünülmüştür.
Özet (Çeviri)
Machine learning-based products that try to make our lives easier are increasing day by day. Thanks to the machine learning models running behind them, these products can be seen or heard and provide information about the context they are in. In this study, three machine learning methods that can hear and understand cat sounds were developed to serve this purpose. These models are Artificial Neural Network, Convolutional Neural Network, and CatBoost. A data library of two thousand sounds was created to understand 6 different cat behaviors. The process proceeded in three basic steps: pre-processing, feature extraction, and classification. One of the most widely used feature extraction algorithms, Mel-Frequency Cepstral Coefficients (MFCCs) has been preferred for Audio Feature Extraction. Accuracy was used as the evaluation metric. A minimum classification success rate of 95% was achieved in all models and the most successful model was determined as Convolutional Neural Network. The reason for this is considered as the presence of convolutional and pooling layers in the model architecture.
Benzer Tezler
- Audio based classification over musical production period: A study on musics of Barış Manço and his contemporaries
Müzik prodüksiyon dönemi üzerine ses tabanlı sınıflandırma: Barış Manço ve çağdaşlarının müzikleri üzerine bir çalışma
METEHAN KÖKTÜRK
Yüksek Lisans
İngilizce
2019
Müzikİstanbul Teknik ÜniversitesiMüzik Ana Bilim Dalı
PROF. DR. CAN KARADOĞAN
- Context aware audio-visual environment awareness using convolutional neural network
Konvolüsyonel sinir ağı kullarak ses ve görüntü aracılığıyla ortam farkındalığı
GİRAY YILLIKÇI
Yüksek Lisans
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesiİletişim Sistemleri Ana Bilim Dalı
PROF. DR. İBRAHİM AKDUMAN
- Perküsyon ve makine öğrenim yöntemleri kullanılarak beton nem seviyesini takibi
Moisture tracking of concrete using percussion and machine learning methods
ZEKİYE ŞEYMA TAMAY
Yüksek Lisans
Türkçe
2023
Elektrik ve Elektronik MühendisliğiSivas Cumhuriyet ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DR. YAVUZ TÜRKAY
- An approach based on sound classification to predict soundscape perception through machine learning
Makine öğrenimi yoluyla işitsel peyzaj algısnın tahmini için ses sınıflandırmasına dayalı bir yaklaşım
VOLKAN ACUN
Doktora
İngilizce
2021
İç Mimari ve Dekorasyonİhsan Doğramacı Bilkent Üniversitesiİç Mimarlık ve Çevre Tasarımı Ana Bilim Dalı
DOÇ. DR. SEMİHA YILMAZER
- Sparse coding based ensemble classifiers combined with active learning framework for data classification
Veri sınıflandırma için aktif öğrenme çerçevesi ile birleştirilmiş ayrık kodlama tabanlı sınıflandırıcı toplulukları
GÖKSU TÜYSÜZOĞLU
Yüksek Lisans
İngilizce
2016
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. YUSUF YASLAN