Müzikal enstrümanların doğrusal ayırtaç analizi yöntemiyle ayırt edilmesi
Identification of musical instruments using discriminant analysis method
- Tez No: 216199
- Danışmanlar: Y.DOÇ.DR. MEHMET DEMİRER
- Tez Türü: Yüksek Lisans
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Enstrüman Tanıma, Polifonik Müzik, Gauscul Karısım Yogunlugu Modeli (GMM), k-En Yakın Komsu Metodu (k-NN), Dogrusal Ayırtaç Analizi (LDA), Spektral Özellikler, Zaman Bölgesi Özellikleri, Kepstral Katsayılar
- Yıl: 2007
- Dil: Türkçe
- Üniversite: Hacettepe Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 79
Özet
Bu çalısmada birden fazla enstrümanla çalınan bir eserdeki Türk Müzigi enstrümanlarının neler olduguna, insan duyma sisteminin yeteneklerine yakın veya esit ölçüde karar verebilecek bir model olusturulması amaçlanmıstır. Bunun için dört farklı Türk Müzigi enstrümanın on bes ayrı kombinasyonundan yararlanılmıstır. İnsan algı yapısı örneginde oldugu gibi birden fazla enstrümanla çalınan eserdeki enstrümanlar birbirinden ayrıstırılmadan, bir bütün olarak ele alınmıs; sesin spektral, zamana baglı ve kepstral özelliklerinden yararlanılmıstır. Bu özelliklerin enstrümanları tanımadaki basarısı tek tek, gruplar halinde ve bir bütün olarak incelenmis, çıkan sonuçların, enstrümanları ayırt etmedeki performansları degerlendirilmistir. Ses ayırt etme algoritmalarının uygulanmasında karsılasılan en büyük sorunlardan birisi ayrım isleminde kullanılan çok boyutlu verilerin islenmesi sırasında kaçınılmaz olarak ortaya çıkan islemsel yüktür. Bu çalısmada çok sayıdaki özelligin yaratacagı islemsel yükü azaltmak amacıyla en önemli özelliklerin kesfedilip, verimsiz özelliklerin elenmesi için yüksek boyuttan daha düsük boyuta dogrusal dönüsüm elde edilmesini saglayan Dogrusal Ayırtaç Analizi (Linear Discriminant Analysis - LDA) yöntemi kullanılmıstır. Özellik vektörlerinin enstrümanları tanımadaki basarısı LDA'nın uygulandıgı ve uygulanmadıgı durumlarda ölçülmüs, LDA'nın özellik vektörlerini ayrımın en iyi yapılabilecegi boyuta yansıtabilme kabiliyeti sayesinde ayırt etme isleminde hesaplama kolaylıgı getirdigi gözlenmistir. Tanıma isleminde sınıflandırma algoritmasının seçimi sistemin performansını dogrudan etkiler. Bu çalısmada enstrümanların ayırt edilmesinde sınıflandırma algoritması olarak, Gauscul Karısım Yogunlugu Modeli (Gaussian Mixture Model - GMM) ve k-En Yakın Komsu (k-Nearest Neighbour ? k-NN) Metodu kullanılmıs ve bu iki yöntem verimlilik ve basarı oranı açısından birbiriyle kıyaslanmıstır. Gauscul karısım yogunlugu modelinde, Gauscul bilesenlerin sayısındaki degisimin sistem performansı üzerindeki etkisi incelenmistir. Egitim asamasında iki farklı eserin herbiri 10'ar saniye uzunlugunda toplam 44 parçaya ayrılmıs bölümleri kullanılmıstır. Test asamasında da, test edilecek eser 10'ar saniyelik bölümlere ayrılarak herbir bölümün hangi enstrümana ait oldugu belirlenmis ve toplam oran 10'ar saniyelik bölümlerden elde edilen sonuçların agırlıklı ortalaması alınarak hesaplanmıstır. MFCC (Mel Frekansı Kepstral Katsayıları), delta MFCC ve delta delta MFCC'nin GMM algoritmasıyla sınıflandırılması sonucu %88.77 basarı oranı elde edilirken; spektral, zaman bölgesi ve kepstral özellik vektörlerinin, GMM algoritmasıyla sınıflandırması sonucunda %78.54`e varan ayırt etme performansı gözlenmistir. Yine bu özelliklerin, LDA ile daha düsük boyuta indirildikten sonra sınıflandırılması ile elde edilen sonuçlarda performansın %90.93 oldugu görülmüstür.
Özet (Çeviri)
In this work, it is aimed to make a model that can decide which instruments are playing in a multi instrumental Turkish Music as good as the human auditory system. Fifteen combinations of four different Turkish Music instruments are used for this purpose. Like in the example of human perception structure, the instruments in multi instrumental music are analysed as a whole without being seperated. Spectral, time domain and cepstral features of sound are used. The recognition performance of these properties are analysed one by one, group by group and as a whole. One of the most important problems in sound recognition algorithms is the computational complexity which occurs during the processing of multi dimensional data used in recognition of instruments. To decrease the computational complexity, Linear Discriminant Analysis (LDA), which provides the feature transformation from higher dimension to lower dimension by discovering the most important features and eliminating uneffective ones, is used. The success rates of feature vectors are observed in both cases when LDA is applied and is not applied then, as a result of these works, having the capability of transforming feature vectors to a low dimensional vector space where separation can be applied best, LDA provides a good computational performance in recognition process . The choice of classification algorithm affects the system performance directly. In this work, in recognition of instruments, Gaussian Mixture Model (GMM) and k ? Nearest Neighbour (k-NN) methods are used as classification algorithms and these two methods are compared according to their success rates and computational efficiency. In Gaussian Mixture Model, the effect of changing the number of mixtures of Gaussian components on system performance are observed. In training stage, 44 different parts of two different songs, having ten second duration each, is used. In testing stage, the test song is divided into parts of ten seconds and the total success rate is calculated by using weighted average of success rates of the 10 second parts success rates. While having a success rate of 88.77% as a result of classifying MFCC (Mel Frequency Cepstral Coefficients), delta MFCC and delta delta MFCC with GMM algorithm, recognition performance of 78.54% is observed by classifying spectral, time domain and cepstral features with GMM. Using the same features with LDA, it is observed that the success rate of 90.93% can be obtained after classification. Key Word: Instrument Recognition, Polyphonic Music, Gaussian Mixture Model (GMM), k-Nearest Neighbour (k-NN), Linear Discriminant Analysis (LDA), Spectral Features, Time Domain Features, Cepstral Coefficients.
Benzer Tezler
- Eclectic Approaches of Paul Hindemith as exemplified in his Sonata for Two Pianos
Paul Hindemith'in İki Piyano İçin Sonat'ında örneklenen eklektik yaklaşımları
HATİCE ÇAĞLA ÇOKER
- Force transducer piano keys as an innovative approach for piano pedagogy
Piyano eğitimi için yenilikçi bir yaklaşım olarak kuvvet algılayıcısına dönüştürülmüş piyano tuşları
ASAF ÇETİN EREN
Doktora
İngilizce
2022
Eğitim ve Öğretimİstanbul Teknik ÜniversitesiMüzik Ana Bilim Dalı
DOÇ. DR. EMİN SÜNBÜLOĞLU
DR. ÖĞR. ÜYESİ AHMET TUNÇ BUYRUKLAR
- Organonscape, atmospheric relations and sound ethnobiology of kemençe in and around Trabzon
Trabzon ve çevresinde organonscape, atmosferik ilişkiler ve kemençenin ses etnobiyolojisi
UĞUR ASLAN
Doktora
İngilizce
2021
Antropolojiİstanbul Teknik ÜniversitesiMüzik Ana Bilim Dalı
PROF. SONGÜL KARAHASANOĞLU
- Geleneksel Türk müziği enstrümanlarının konçertino kullanımlarıyla, konçerto grosso türünde eser çalışması
New composition as concerto grosso for baroque orchestra and Turkish ensemble
NAĞME YARKIN
- İzmir'de yaşayan Karaçay Türkleri'nin müzik kültürü
Musical culture of Karachay Turks living in Izmir
SEDAT BOZAN
Yüksek Lisans
Türkçe
2023
MüzikNiğde Ömer Halisdemir ÜniversitesiMüzikoloji Ana Bilim Dalı
DOÇ. DR. RESUL BAĞI