Audio classification based on machine learning: Understanding animal behavior through sound

Makine öğrenimine dayalı ses sınıflandırması: Hayvan davranışını ses yoluyla anlamak

PDF İndir

Tez No: 830664
Yazar: FURKAN YAZ
Danışmanlar: PROF. DR. CEYLAN YOZGATLIGİL
Tez Türü: Yüksek Lisans
Konular: İstatistik, Statistics
Anahtar Kelimeler: Belirtilmemiş.
Yıl: 2023
Dil: İngilizce
Üniversite: Orta Doğu Teknik Üniversitesi
Enstitü: Fen Bilimleri Enstitüsü
Ana Bilim Dalı: İstatistik Ana Bilim Dalı
Bilim Dalı: Belirtilmemiş.
Sayfa Sayısı: 61

Özet

Her geçen gün hayatımızı kolaylaştırmaya çalışan makine öğrenmesi temelli ürünler artmaktadır. Bu ürünler arkalarında çalışan makine öğrenmesi modelleri sayesinde görebilir veya duyabilir hale gelerek bulunduğu bağlam hakkında bilgi sağlarlar. Bu çalışmada da buna hizmet etmesi amacıyla kedi seslerini duyup anlayabilen üç makine öğrenmesi yöntemi geliştirildi. Bu modeller Yapay Sinir Ağları, Evrişimli Sinir Ağları ve CatBoost. 6 farklı kedi davranışını anlayabilmek için iki bin seslik bir veri kütüphanesi oluşturuldu. Süreç ön işleme, özellik çıkarma ve sınıflandırma olmak üzere üç temel adımda ilerlemiştir. Ses özelliği çıkarma için en yaygın kullanılan özellik çıkarma algoritmalarından birisi olan Mel-Frequency Cepstral Coefficients (MFCCs) tercih edilmiştir. Değerlendirme metriği olarak doğruluk kullanılmıştır. Modellerin hepsinde minimum %95 sınıflandırma başarı oranına ulaşılmış ve en başarılı olan model Evrişimli Sinir Ağları olarak tespit edilmiştir. Buna gerekçe olarak ise model mimarisinde evrişimli ve havuz katmanlarının varlığı olarak düşünülmüştür.

Özet (Çeviri)

Machine learning-based products that try to make our lives easier are increasing day by day. Thanks to the machine learning models running behind them, these products can be seen or heard and provide information about the context they are in. In this study, three machine learning methods that can hear and understand cat sounds were developed to serve this purpose. These models are Artificial Neural Network, Convolutional Neural Network, and CatBoost. A data library of two thousand sounds was created to understand 6 different cat behaviors. The process proceeded in three basic steps: pre-processing, feature extraction, and classification. One of the most widely used feature extraction algorithms, Mel-Frequency Cepstral Coefficients (MFCCs) has been preferred for Audio Feature Extraction. Accuracy was used as the evaluation metric. A minimum classification success rate of 95% was achieved in all models and the most successful model was determined as Convolutional Neural Network. The reason for this is considered as the presence of convolutional and pooling layers in the model architecture.

Benzer Tezler

Tez No
964704
Sosyal mühendislikte komplo tabanlı içeriklerin yapay zekâ ile analizi
Analysis of conspiracy-based content in social engineering with artificial intelligence
EMEL KOÇYİĞİT
Yüksek Lisans
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Sakarya Üniversitesi
Bilişim Sistemleri Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ FATİH ÇALLI
Tez No
587329
Audio based classification over musical production period: A study on musics of Barış Manço and his contemporaries
Müzik prodüksiyon dönemi üzerine ses tabanlı sınıflandırma: Barış Manço ve çağdaşlarının müzikleri üzerine bir çalışma
METEHAN KÖKTÜRK
Yüksek Lisans
İngilizce
2019
Müzik İstanbul Teknik Üniversitesi
Müzik Ana Bilim Dalı
PROF. DR. CAN KARADOĞAN
Tez No
564136
Context aware audio-visual environment awareness using convolutional neural network
Konvolüsyonel sinir ağı kullarak ses ve görüntü aracılığıyla ortam farkındalığı
GİRAY YILLIKÇI
Yüksek Lisans
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol İstanbul Teknik Üniversitesi
İletişim Sistemleri Ana Bilim Dalı
PROF. DR. İBRAHİM AKDUMAN
Tez No
940101
Yeni nesil makine öğrenmesi yöntemleritabanlı ortam seslerinden duygu ve şiddet tespiti
Emotion and violence detection from environmental sounds based on next generation machine learning methods
ARİF METEHAN YILDIZ
Doktora
Türkçe
2025
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Fırat Üniversitesi
Adli Bilişim Mühendisliği Ana Bilim Dalı
DOÇ. DR. TÜRKER TUNCER
Tez No
810467
Perküsyon ve makine öğrenim yöntemleri kullanılarak beton nem seviyesini takibi
Moisture tracking of concrete using percussion and machine learning methods
ZEKİYE ŞEYMA TAMAY
Yüksek Lisans
Türkçe
2023
Elektrik ve Elektronik Mühendisliği Sivas Cumhuriyet Üniversitesi
Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
DR. YAVUZ TÜRKAY

Geri Dön