Classification of music emotions with pre-trained models
Önceden eğitilmiş modellerle müzik duygularının sınıflandırılması
- Tez No: 895615
- Danışmanlar: Assist. Prof. Dr. ABDÜL KADİR GÖRÜR
- Tez Türü: Yüksek Lisans
- Konular: Bilim ve Teknoloji, Science and Technology
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: İngilizce
- Üniversite: Çankaya Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Enformatik Ana Bilim Dalı
- Bilim Dalı: Enformatik (İngilizce) Bilim Dalı
- Sayfa Sayısı: 133
Özet
Müzik tüm sanatların içinde en duygusal olanıdır ve bu nedenle de insanlara en yakın olan ve en sevilenidir. Duygular düşünme, davranış ve karar verme biçimlerimizi etkileyen, insan yaşamının merkezi bir parçasıdır. Temel duygularımızı mutluluk, üzüntü, korku, öfke, şaşkınlık ve iğrenme olmak üzere altı tür olarak sınıflandıran Paul Ekman da dahil olmak üzere pek çok bilim insanı duygular üzerinde araştırmalar yapmıştır. Bu sınıflandırma, duyguların davranışlarımızı ve günlük etkileşimlerimizi nasıl etkilediğini anlamamız açısından yardımcı olmaktadır. Duygu analizi sağlık, eğitim, iş, pazarlama, teknoloji ve daha birçok alanda faydalı olabilir. Aşağıdakiler de dahil olmak üzere çeşitli uygulamalar duygu çıkarımını ve analizini kolaylaştırır: • Metin Analizi: Doğal Dil İşleme (NLP) duygu çıkarımı yapmak için yazılı metinleri analiz eder. • Ses Analizi: Beyond Verbal ve Affectiva gibi uygulamalar, duyguları çıkarmak için ses tonunu analiz eder, bu da müşteri hizmetleri merkezlerinde yararlıdır. • Görüntü ve Video Analizi: Bilgisayarla Görüntüleme teknikleri, görüntü ve videolardan duyguları tespit etmek için yüz ifadelerini analiz eder. Müzik, melodileri, ritimleri ve tonları ile çok çeşitli duyguları tetikleyerek insan duygularını harekete geçirme ve ifade etme konusunda özel bir yere sahiptir. Müzikal duyguların analizi, araştırmacıların farklı müzikal unsurların dinleyicilerin duygularını nasıl etkilediğini anlamaya çalıştıkları ve giderek büyümekte olan bir araştırma alanıdır., Araştırmam, derin öğrenmeyi kullanarak müziksel duyguları sınıflandırmaya odaklanmaktadır. Öne sürdüğüm düşünceyi gerçekleştirmek için iki ses veri kümesini spektrogram görüntülerine dönüştürdükten sonra ResNet-50, DenseNet-121 ve Inception-v3 gibi ön-eğitime sahip bazı modelleri bu görüntülerin üzerinde geliştirdim. Ses veri kümeleri on saniyelik bölümlere ayrıldı ve iki çeşit spektrogram dönüşümü kullanıldı: klasik spektrogram ve Mel spektrogramı. Sonuçlar, her iki veri kümesinde de ResNet50 modelinin en yüksek performansı elde ettiğini, ancak DenseNet121'in ikinci veri kümesinde veri dengeleme tekniklerinden birini kullanarak Mel spektrogramı ile daha yüksek bir doğruluğa sahip olduğunu, ancak yine de ResNet-50 modelinin performansının çıkarım ve genelleme görevi açısından daha yüksek olduğunu göstermiştir. ResNet-50 aynı zamanda ilk veri kümesinde de en yüksek doğruluğu elde etmiştir. Bu araştırma, derin öğrenme tekniklerinin müzikal duyguları analiz etmek ve sınıflandırmak için nasıl kullanılabileceğine dair bir fikir sağlayarak müzik ve duyguların daha iyi anlaşılmasına katkıda bulunmaktadır.
Özet (Çeviri)
Music is the most emotional of all arts and is therefore the closest and dearest to people. Emotions are a central part of human life, influencing how we think, act, and make decisions. Many scientists have studied emotions, including Paul Ekman, who classified basic emotions into six kinds: happiness, sadness, fear, anger, surprise, and disgust. This classification helps in understanding how emotions influence our behavior and daily interactions. Emotion analysis can benefit various fields such as healthcare, education, business, marketing, technology, and more. Various applications facilitate emotion extraction and analysis, including: • Text Analysis: Natural Language Processing (NLP) analyzes written texts to extract emotions. • Voice Analysis: Applications like Beyond Verbal and Affective analyze voice tone to extract emotions, which is useful in customer service centers. • Image and Video Analysis: Computer Vision techniques analyze facial expressions to identify emotions from images and videos. Music occupies a special place in stirring up and expressing human feelings, with its melodies, rhythms, and tones provoking a wide range of emotions. The analysis of musical emotions is a growing research area where scholars seek to understand how different musical elements influence listeners' feelings. My study focuses on classifying music sentiments using Deep Learning. To implement my proposed idea, I used some pre-trained models such as ResNet50, DenseNet121, and Inception V3 on two audio datasets after converting them to spectrogram images. The audio dataset was divided into ten-second segments, and two types of spectrogram transformations were used: classic spectrogram and Mel spectrogram. The outcomes demonstrated that the ResNet50 model achieved the highest performance on both datasets, although DenseNet121 had a higher accuracy with the Mel spectrogram using one of the data balancing techniques on the second dataset, but the performance of the ResNet50 model is still higher in terms of inference and generalization task. It also achieved the highest accuracy on the first dataset. This study provides insight into how Deep Learning techniques can be applied to analyzing and classifying musical emotions, contributing to a better understanding of music and emotions.
Benzer Tezler
- Kullanıcıların zaman serileri biçimindeki davranış desenlerinin modellenmesi ve tahminlenmesi
Modeling and forecasting user behavior patterns in time series
YİĞİTCAN ŞENER
Doktora
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEge ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. AYBARS UĞUR
- Derin öğrenme tabanlı biyomedikal karar destek sistemlerinin oluşturulması
Establishment of biomedical decision support systems through deep learning techniques
HARUN ÇİĞ
Doktora
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHarran ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. MEHMET TAHİR GÜLLÜOĞLU
- Mekân, marka, statü: Türkiye'de caz
Venue, brand, status: Jazz in Turkey
MİNEN ÇALIŞ
Yüksek Lisans
Türkçe
2024
Müzikİstanbul Teknik ÜniversitesiMüzikoloji ve Müzik Teorisi Ana Bilim Dalı
DOÇ. DR. ZEYNEP GONCA İNCEDERE
- Watson insan bakım kuramına temellendirilmiş mandala sanatının ve değer açıklaştırmanın kanser tanılı çocukların ebeveynlerinin kaygı ve duygu durumuna etkisi
The effect of mandala art and value clarification based on watson human care theory on the anxiety and emotional state of parents of children diagnosed with cancer
MELTEM GÜRCAN
Doktora
Türkçe
2024
HemşirelikAkdeniz ÜniversitesiÇocuk Sağlığı ve Hastalıkları Hemşireliği Ana Bilim Dalı
DOÇ. DR. SEVCAN ATAY TURAN
- Şan tekniğinin Türk halk müziğinde uygulanması ve karşılaşılan sorunlar
Başlık çevirisi yok
DİLEK TATLIDİL
Yüksek Lisans
Türkçe
1998
Müzikİstanbul Teknik ÜniversitesiTürk Halk Müziği Ana Sanat Dalı
YRD. DOÇ. DR. AFŞİN EMİRALİOĞLU