Kuş seslerinden sınıflandırma yapılması: Bir ses tanıma uygulaması
Classification of bird sounds: A voice recognition application
- Tez No: 917912
- Danışmanlar: DOÇ. DR. MURAT GEZER
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: Türkçe
- Üniversite: İstanbul Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Enformatik Ana Bilim Dalı
- Bilim Dalı: Enformatik Bilim Dalı
- Sayfa Sayısı: 91
Özet
Kuş türlerinin otomatik tanımlanması, ekolojik araştırmalar ve biyoçeşitlilik izleme çalışmaları için kritik öneme sahiptir. Bu tez kapsamında, İstanbul/Küçükçekmece bölgesindeki kuş türlerinin ses kayıtlarından yüksek doğrulukla sınıflandırılması için otomatik bir sistem geliştirilmiştir. Çalışmada BirdCLEF 2024 veri kümesinden seçilen 26 kuş türüne ait ses kayıtları kullanılmıştır. Geliştirilen sistem iki aşamalı olup: birinci aşamada ses kayıtları 5 ve 10 saniyelik kesitler halinde işlenmiş ve mel spektrogramlarına dönüştürülmüştür. İkinci aşamada ise farklı derin öğrenme mimarileri (ResNet50, DenseNet121 ve EfficientNet-B0) kullanılarak sınıflandırma modelleri oluşturulmuştur. Çalışmada üç farklı mimarinin performansını karşılaştırmak için kapsamlı deneyler gerçekleştirilmiştir. ResNet50 mimarisi 5 saniyelik kesitlerde %73, 10 saniyelik kesitlerde %76; DenseNet121 mimarisi 5 saniyelik kesitlerde %75, 10 saniyelik kesitlerde %77; EfficientNet-B0 mimarisi ise 5 saniyelik kesitlerde %74, 10 saniyelik kesitlerde %79 doğruluk oranı elde etmiştir. Tez kapsamında önerilen topluluk oylaması yaklaşımı ile 5 saniyelik kesitlerde %76, 10 saniyelik kesitlerde %81 doğruluk oranına ulaşılmıştır. Deneysel sonuçlar, geliştirilen sistemin kuş seslerinin otomatik sınıflandırılmasında etkili bir çözüm sunduğunu göstermektedir.
Özet (Çeviri)
Automatic identification of bird species is crucial for ecological research and biodiversity monitoring studies. In this thesis, an automatic system has been developed for high-accuracy classification of bird species from sound recordings in the Istanbul/Küçükçekmece region. The study utilized sound recordings of 26 bird species selected from the BirdCLEF 2024 dataset. The developed system consists of two stages: in the first stage, sound recordings were processed in 5 and 10-second segments and converted into mel spectrograms. In the second stage, classification models were created using different deep learning architectures (ResNet50, DenseNet121, and EfficientNet-B0). Comprehensive experiments were conducted to compare the performance of these three different architectures. The ResNet50 architecture achieved accuracy rates of 73% for 5-second segments and 76% for 10-second segments; the DenseNet121 architecture achieved 75% for 5-second segments and 77% for 10-second segments; and the EfficientNet-B0 architecture achieved 74% for 5-second segments and 79% for 10-second segments. The ensemble voting approach proposed within the scope of the thesis achieved accuracy rates of 76% for 5-second segments and 81% for 10-second segments. Experimental results demonstrate that the developed system provides an effective solution for automatic classification of bird sounds.
Benzer Tezler
- Otomobil motor sesinden modelinin tanınması
Recognition of vehicle models from engine sounds
EFECAN KARAMAN
Yüksek Lisans
Türkçe
2018
Makine MühendisliğiAkdeniz ÜniversitesiMakine Mühendisliği Ana Bilim Dalı
PROF. DR. HİKMET RENDE
- Etnisite ve müzik kültürü perspektifinden Adıyaman metropolitliği
The metropolitanate of Adiyaman from the perspective of ethnicity and music culture
SEÇİL SOYKAN
- Sesin mekân deneyimine etkisi: Üniversite fakülte binaları üzerinden bir inceleme
The effect of sound on spatial experience: A study on university faculty buildings
ELİF SENA KOCA
Yüksek Lisans
Türkçe
2024
MimarlıkMaltepe ÜniversitesiMimarlık Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ASENA KUMSAL ŞEN BAYRAM
- Design and development of audio-emotional serious games for audiology therapy
Odyoloji terapisi için işitsel-duygusal ciddi oyunlar tasarlama ve geliştirme
EGE VERİM
Yüksek Lisans
İngilizce
2023
Bilim ve Teknolojiİstanbul Teknik ÜniversitesiOyun ve Etkileşim Teknolojileri Ana Bilim Dalı
PROF. DR. HATİCE KÖSE