Geri Dön

Bird call detection using deep learning

Derin öğrenmeyi kullanarak kuş ötüşü tespiti

  1. Tez No: 632487
  2. Yazar: CİHAN YÜKSEL
  3. Danışmanlar: DOÇ. DR. ENGİN MAŞAZADE
  4. Tez Türü: Yüksek Lisans
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2020
  8. Dil: İngilizce
  9. Üniversite: Yeditepe Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Elektrik Elektronik Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 90

Özet

Bu tezde, kuş sesi tespiti için farklı derin öğrenme yöntemlerini karşılaştırıyoruz. Bu amaçla, dijital sinyal işleme yöntemleri kullanılarak, birden fazla alandan kayıt içeren ses veri setlerimiz, mel spektrogram görüntüleri, mel frekanslı sepstral katsayıları (MFCC) veya gammaton frekanslı sepstral katsayıları olarak dönüştürülmektedir. Evrişimli sinir ağımız (CNN) için girdi katmanı, evrişim katmanı, normalizasyon katmanı, aktivasyon katmanı, havuz katmanı, tam bağlantılı katman ve sınıflandırma katmanı gibi farklı katmanlar kullanılmaktadır. Gri tonlamalı mel spektrogram görüntüleri, CNN'imizi katman boyutları, katman sayısı, giriş boyutları ve eğitim seçenekleri gibi farklı parametre ayarları ile eğitmek için kullanılmaktadır. Öte yandan, çıkarılan gammaton frekanslı sepstral katsayıları ve mel frekanslı sepstral katsayıları, tekrarlayan sinir ağı (RNN) dayalı çift yönlü ve tek yönlü uzun kısa süreli bellek ağlarının (LSTM) özellikleri olarak kullanılmaktadır. Hem MFCC hem de GTCC, basit bir sinir ağı algoritması için girdi olarak da kullanılmaktadır. Her iki uzun kısa süreli bellek ağımızda, karşılaştırma için farklı sayıda LSTM kullanılmaktadır. Algılamanın doğruluğu, alıcı çalışma karakteristikleri eğrisinin altındaki alanı (AUC) hesaplama metodu kullanılarak farklı parametreler için tüm yöntemler için doğrulanmaktadır.

Özet (Çeviri)

In this thesis, we compare different deep learning methods for bird sound detection. For this purpose, by using digital signal processing methods, our audio data sets containing recordings from multiple fields are turned into features as mel spectrogram images, mel frequency cepstral coefficients (MFCC) or gammatone frequency cepstral coefficients (GTCC). For our convolutional neural network (CNN), we use different layers such as input layer, convolution layer, normalization layer, activation layer, pooling layer, fully connected layer and classification layer. The gray scale mel spectrogram images are used to train our CNN for different parameter settings such as layer sizes, layer numbers, input sizes and training options. On the other hand, extracted gammatone frequency cepstral coefficients and mel frequency cepstral coefficients are used as features for recurrent neural network (RNN) based bidirectional and unidirectional long short term memory networks (LSTM). Both MFCC and GTCC are also used as input for a simple neural network algorithm. For both of our long short term memory networks, we use different number of LSTM for comparison. Accuracy of the detection is validated for all methods for different parameters using area under curve (AUC) of receiver operating characteristics.

Benzer Tezler

  1. Anadolu Selçuklu dönemi seramiklerinde kuş motifi ve günümüz seramik sanatına uyarlanması

    Bird motif in ceramics of the Anatolian Seljuk period and its application to today's ceramic art

    ELİF BEKDİK

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Güzel SanatlarNecmettin Erbakan Üniversitesi

    Seramik Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ AZİZE MELEK ÖNDER

  2. Türk-İran batılılaşma dönemi karşılaştırmaları ve ressam Kemal Ol Molk

    Comparisons of Turkish-Iranian westernization period and painter Kemal Ol Molk

    YOUNES NAMVAR

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Güzel SanatlarAnadolu Üniversitesi

    Sanat Tarihi Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ZEYNEP ERTUĞRUL

  3. Computer assisted vocabulary learning: A study with Turkish 4th grade efl learners

    Bilgisayar destekli sözcük öğrenimi: Yabancı dil olarak İngilizce öğrenen dördüncü sınıf öğrencileriyle yapılan bir çalışma

    SENEM CELLAT

    Yüksek Lisans

    İngilizce

    İngilizce

    2008

    Eğitim ve ÖğretimAnadolu Üniversitesi

    İngiliz Dili Eğitimi Ana Bilim Dalı

    PROF. DR. GÜL DURMUŞOĞLU KÖSE

  4. Hakas destanlarında şekil değiştirme motifi

    Shapeshifting motif in Hakas epics

    ESRA KÖŞKER

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Halk Bilimi (Folklor)Kırşehir Ahi Evran Üniversitesi

    Türk Dili ve Edebiyatı Ana Bilim Dalı

    PROF. DR. SALAHADDİN BEKKİ

  5. A spatial conception based on walking: Critical walk

    Yürümeye dayalı mekânsal bir kavrayış: Eleştirel yürüyüş

    NİLSU ALTUNOK

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Mimarlıkİstanbul Teknik Üniversitesi

    Mimarlık Ana Bilim Dalı

    PROF. DR. PELİN DURSUN ÇEBİ