Stacked frequency-timeGRUs for continuous arousal recognition from musical audio
Müzikal ses verisi üzerinde sürekli uyarılma tanıması için yığın yapılı frekans-zaman GRU mimarisi
- Tez No: 728825
- Danışmanlar: PROF. DR. YÜCEL YEMEZ, PROF. DR. ENGİN ERZİN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2021
- Dil: İngilizce
- Üniversite: Koç Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 35
Özet
Duyguların uyarılma-valans düzleminde temsil edildiği, müzikal ses verisinde duygu tanıma için sürekli uyarılma saptaması problemini ele alıyoruz. Çalışmamızda, öznitelik olarak mel-spectrogram katsayılarını kullanan iki yinelemeli yapay sinir ağının füzyonu olan yeni bir yöntem sunuyoruz: Öznitelik çıkarıcı olarak kullanılan, frekans ekseninde işleyen bir çift yönlü GRU ve ardından zaman ekseninde işleyen, modelin gerçek zamanda gerçeklenebilir olabilmesi için tek yönlü olarak seçilen i-kinci bir GRU. Bu yöntem MediaEval2015- Emotion in Music veri kümesi üzerinde değerlendirilmekte ve literatürde bulunan gerçek zamanda gerçeklenebilir modellerin raporladığı sonuçlardan daha iyi olan 0.215 RMSE değerine ulaşmaktadır.
Özet (Çeviri)
We address the problem of continuous arousal detection for emotion recognition in musical audio pieces where emotions are represented in the two-dimensional arousal-valence space. We propose a novel method which is a combination of two recurrent neural networks using mel-spectrogram features: A bidirectional GRU network along the frequency dimension as a feature extractor, stacked with a GRU network along the temporal dimension, which is unidirectional for real-time adaptability. The method is evaluated on the MediaEval2015- Emotion in Music Dataset, achieving an RMSE of 0.215 which is better than the results reported by real-time adaptable state-of-the-art models.
Benzer Tezler
- Design and electromechanical modeling of vertically stacked silicon nanowire arrays as coupled resonators
Üst üste yerleştirilmiş silisyum nanotel dizilerinin bağlaşımlı çınlaçlar olarak tasarımı ve elektromekanik modellemesi
İSMAİL YORULMAZ
Yüksek Lisans
İngilizce
2012
Elektrik ve Elektronik MühendisliğiKoç ÜniversitesiMalzeme Bilimi ve Mühendisliği Ana Bilim Dalı
DOÇ. DR. B. ERDEM ALACA
- Simultaneous frequency and direction finding by frequency scanning wideband array
Frekans taramalı geniş bantlı anten dizisiyle eş zamanlı frekans ve yön bulma
NAZLI CANDAN
Doktora
İngilizce
2003
Elektrik ve Elektronik MühendisliğiOrta Doğu Teknik ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. ALTUNKAN HIZAL
DOÇ. DR. SENCER KOÇ
- Yüksek frekans ve yüksek gerilim çıkışlı DC/DC dönüştürücü
High frequency and high voltage output DC/DC converter
SERKAN ELVER
Yüksek Lisans
Türkçe
2006
Elektrik ve Elektronik MühendisliğiMarmara ÜniversitesiElektrik Eğitimi Ana Bilim Dalı
YRD. DOÇ. DR. YAŞAR BİRBİR
- İki-modlu katlı dairesel mikroşerit yama antenlerin tasarımı ve mımo konfigürasyonları için ilinti/spektral verimlilik analizleri
Design of dual-mode stacked circular microstrip patch antennas and correlation/spectral efficiency analysis for mimo configurations
İBRAHİM GÖRGEÇ
Yüksek Lisans
Türkçe
2009
Elektrik ve Elektronik MühendisliğiHacettepe ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. ERDEM YAZGAN
- Design of a wideband and bi directional transducer for underwater communications
Sualtı iletişimi için geniş bandlı ve çift yönlü akustik çevirici modellemesi
IŞIL CEREN ELMASLI
Yüksek Lisans
İngilizce
2007
Elektrik ve Elektronik Mühendisliğiİhsan Doğramacı Bilkent ÜniversitesiElektrik ve Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. HAYRETTİN KÖYMEN