Geri Dön

Türk müziği enstrümanlarının öznitelik vektörlerinin çıkarılması ve yapay sinir ağları kullanılarak sınıflandırılması

Obtaining the feature vectors of Turkish musical instruments and classification using artificial neural networks

  1. Tez No: 467281
  2. Yazar: MEHMET HAŞİM AÇANAL
  3. Danışmanlar: PROF. DR. EMİNE AYAZ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Elektrik ve Elektronik Mühendisliği, Müzik, Electrical and Electronics Engineering, Music
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2017
  8. Dil: Türkçe
  9. Üniversite: İstanbul Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 81

Özet

Bu tezin esas amacı, çeşitli Türk Müziği enstrümanlarının tını karakteristiğinin sayısal ortamda analizi ile bu enstrümanların birbirinden ayırt edilmesinin ve sınıflandırılmasının sağlanmasıdır. Zaman zaman insan kulağı için bile bir hayli zor olan bu ayırt etme işleminin yüksek başarımlı olarak gerçekleştirilmesi hedeflenmiştir. Yapılacak sınıflandırmanın birkaç açıdan fayda sağlayabileceği düşünülmüştür: - Sınıflandırma işlemi, her bir enstrümanın diğer enstrümanlarla olan ilişkisini belirleme üzerinden yapıldığı için farklı bir enstrümanın ses kaydından da o enstrümanın yapısal özellikleri hakkında çıkarım yapılması sağlanabilir. - Tek enstrümanlı eser kayıtlarının (taksim vb.) makam teorisi açısından sayısal veriler ışığında daha net bir şekilde incelenmesi mümkün kılınabilir. - Ayrıca birden fazla enstrümanlı kayıtlar için de hem hangi enstrümanların kayıtta yer aldığını tespit etmek hem de her enstrümanın çaldığı notaları ayrı ayrı belirleyebilmek adına başlangıç niteliğinde bir çalışma ve esin kaynağı olması ümit edilmiştir. Tezin ilk bölümünde Türk ve Batı Müziğinde kullanılan ses sistemleri hakkında bilgi verilmiş, aradaki notasyon farkları izah edilmeye çalışılmıştır. İkinci bölümünde ise kayıt ortamının özellikleri anlatılmış ve kaydı alınan Türk Müziği enstrümanlarının kısa tarihçesi ile tanıtımı yapılmıştır. Kayıtlar, İstanbul Teknik Üniversitesi Konservatuarı Müzik Teknolojileri Bölümünde bulunan ses kayıt stüdyosunda, her enstrüman için uygun mikrofonlama tekniği belirlendikten sonra alınmıştır. Aynı ortam şartları altında, her enstrüman için kromatik olarak bir oktavlık ses sahasındaki bütün nota değerlerinin ses kaydının alınmasının ardından sınıflandırma yapabilmek amacıyla, temelde iki adımdan oluşan bir metod izlenmiştir. İlk olarak, alınan ses kayıtları belli matematiksel yöntemler kullanılarak enstrümanların akustik özelliklerini yansıtacak nitelikte verilere dönüştürülmüş ve ardından içerisinde öğrenme algoritmaları içeren çeşitli yapay sinir ağları tarafından sınıflandırılması sağlanmıştır. Bu aşamalar için kullanılan matematiksel yöntemler hakkında, tezin üçüncü ve dördüncü bölümlerinde genel bir bilgi verilmiş olup, beşinci ve altıncı bölümlerde ise uygulama sonuçları gösterilmiştir. Öznitelik vektörlerini elde etme yöntemi olarak Kepstrum, Hızlı Fourier Dönüşümü (HFD), Otoregresif Model (AR), zaman domenindeki istatistiksel parametreler (ZDİP) ve Ayrık Dalgacık Dönüşümü (ADD) denenmiş olup, elde edilen veriler Çok Katmanlı İleri Beslemeli Yapay Sinir Ağında giriş vektörü olarak kullanılmıştır. Öznitelik vektörünün tarzına göre YSA'da, geriye yayılım yöntemlerinden (Backpropagation ya da BP) Levenberg-Marquardt (L-M) veya Gradyan İniş (Gİ) yaklaşımları ele alınmıştır. Giriş vektörünün boyutu küçüldüğünde, çalışma hızının artması sebebiyle Levenberg-Marquardt yöntemi tercih edilirken, büyük giriş vektörüne sahip YSA'da ise Gİ yöntemi kullanılmıştır. Daha açık bir deyişle, Kepstrum ve HFD ile elde edilen veriler için Gİ, zaman domeni istatistiksel parametreleri, AR ve ADD modelle elde edilen veriler için hem Gİ hem de L-M yöntemleri kullanılmış elde edilen sonuçların başarı yüzdeleri karşılaştırılmıştır. Genelde, çok katmanlı ileri beslemeli ağ uygulamalarında giriş sayısının iki katından daha fazla gizli tabaka kullanılması önerilmesine rağmen bu tez kapsamında yapılan analizde giriş sayısı oldukça fazla olduğu ve böyle bir programı çalıştırabilmek için bir hayli büyük işlemci kapasitesi gerektireceğinden, ağın gizli katmanında 40'ar adet nöron kullanılmasına karar verilmiştir. Çıkış tabakasında ise biri enstrümanı sınıflandırmaya biri de nota değerlerini tanımaya çalışan iki adet nöron vardır. Çalışma esnasında 6 adet Türk Müziği enstrümanı (Ud, kanun, 3 telli klasik kemençe, bağlama, ney ve tanbur) için rast, zirgüle, neva ve gerdaniye perdeleri olmak üzere 4 ayrı frekans değerinde ses kayıtları alınmış, yukarıda belirtilen yöntemler ayrı ayrı uygulanarak öznitelik vektörleri çıkartılmış, ardından çok katmanlı ileri beslemeli geri yayılımlı yapay sinir ağları kullanılarak bu enstrümanlar sınıflandırılmaya çalışılmıştır. Yapılan analizler göstermiştir ki en başarılı sınıflandırma, HFD ile öznitelik vektörlerinin çıkarılarak bu vektörlerin Gradyan İniş algoritması yardımıyla geri yayılım yapan YSA'na giriş olarak verilmesi sonucu elde edilmiştir. Aynı öğrenme metoduna sahip YSA'na Kepstrum analizinden elde edilen verilerin giriş vektörü olarak uygulanması, nota tahmin işleminde ayrık dalgacık dönüşümünden daha başarılı olurken, enstrüman tespiti konusunda ADD'nin biraz gerisinde kalmıştır. HFD'den sonra ikinci sırada başarılı performansın bu iki yaklaşım ile elde edildiği söylenebilir. Denemesi yapılan beş metoddan biri olan, Otoregresif (AR) model için YSA'da Levenberg Marquardt yöntemi daha iyi sonuç vermiştir. En az başarıma ulaşılan yöntem ise ortalama değer, standart sapma, çarpıklık ve basıklık gibi sinyalin zaman domenindeki istatistiksel paremetrelerini ihtiva eden öznitelik vektörlerinin işlenmesi ile olmuştur. Bu giriş vektörü için YSA'da L-M yöntemini kullanmanın, Gİ'ye göre daha başarılı olduğu gözlenmiştir. Ve son olarak, elde edilen bu bilgiler ışığında oluşturulan karşılaştırma çizelgeleri, tezin sonuç bölümünde verilmiştir.

Özet (Çeviri)

The main aim of this thesis is to analyze the timbre characteristics of various Turkish Musical instruments in digital environment in addition to discriminating and classifying these instruments. It is aimed that this discrimination process, which is sometimes difficult even for the human ear, is performed with high performance. This classification is thought to be benefical in several respects: - Since the classification in this thesis is based on the relation of each instrument with other ones, it is possible to deduce the structural characteristics of an instrument from its sound recording. - It is possible to examine recordings with single instrument (taqsim etc.) more clearly in terms of maqam theory in the light of numerical datas. - It is hoped that for recordings with more than one instrument, it will be a starting point and source of inspiration in order to determine which instruments take place in the recording and to determine the notes played by each instrument. In the first part of the thesis, information about the sound systems which is used in Turkish and Western Classical Music was given and the differences between the notes were tried to be explained. In the second part, the characteristics of the recording medium are explained and the short history of the recorded Turkish musical instruments was introduced. The recordings were taken in the recording studio of the Istanbul Technical University Conservatory Music Technologies Department after the appropriate microphone technique was specified for each instrument. Under the same ambient conditions, a basic two-step method was followed in order to be able to categorize each musical instrument after taking the sound record of all note values in a chromatic octave sound field. First of all, the sound recordings are transformed into datas which reflect the acoustic properties of the instruments using certain mathematical methods and then they are classified by various artificial neural networks including learning algorithms. A general information is provided about mathematical methods that are used for the third and the forth stages of the thesis and the application results are shown in the fifth and the sixth stages of the thesis. Statistical parameters such as Cepstrum, Fast Fourier Transform (FFT), Autoregressive Model (AR), time domain statistical parameters (TDSP) and Discrete Wavelet Transform (DWT) have been employed as the method of obtaining the attribute vectors. The datas obtained has been used as an input vector on the Multilayer Feedforward Artificial Neural Network. According to the methods of backpropagation (BP), Levenberg-Marquardt (L-M) or Gradient Decent (GD) approaches have been employed in Artificial Neural Networks (ANN) according to the style of the feature vector. When the size of the input vector decreases, the Levenberg-Marquardt method is preferred because the working speed increases, whereas the GD method is used for the ANN with the large input vector. In other words, GD method has been used for the datas obtained with the cepstrum and FFT while both GD and L-M methods were used for the datas obtained with the time-domain statistical parameters, AR and ADD models. The success rates of the obtained results were compared. In general, it is recommended that multilayer feed-forward networks use more than twice as many hidden layers as the number of input. However, as the number of inputs in the analysis made in this thesis is considerably high, and a considerable capacity of processor is required in order to operate such a program, it was decided to use 40 neurons in the hidden layer of the network. In the output layer, there are two neurons, one of them classifying the instrument and the other trying to identify the value of the note. In this study, sound recordings were made at four different frequency values, namely rast, zirgüle, neva and gerdaniye for 6 Turkish Musical instruments (ud, kanun, classical kemençe with three strings, bağlama, ney and tanbur). And then feature vectors were obtained implementing each of the above mentioned methods, and they were tried to be classified using multilayer feedforward artificial neural networks. As a result of the analysis, the most successful classification is obtained by documenting the attribute vectors with FFT and giving them as an input to the backpropagation ANN with the help of Gradient Decent algorithm. Applying the data obtained from the Capstrum analysis to the artificial neural networks with the same learning method as the input vector is more successful than the discrete wavelet transform in the prediction of the notes but it is less successful the discrete wavelet transform in the instrument detection. It can be said that success in the second rank after HFD is achieved by these two approaches. The Levenberg Marquardt method yielded better results for the autoregressive (AR) model, which is one of the five methods to be tested. The least successful method has been the processing of feature vectors containing statistical parameters of the signal such as mean value, standard deviation, skewness and kurtosis.For this input vector, it has been observed that Levenberg-Marquardt methods were more successful in ANN. In conclusion, the comparison charts generated in the light of this obtained information are given in the final section of the thesis.

Benzer Tezler

  1. Türk müziği enstrümanlarının tınısal özelliklerinin incelenmesi ve bu çerçevede mikrofonlama tekniği

    Analysis of turkish music instruments timbral characteristics and the technique of mikiing in this context

    HAKAN MAZLUM

    Yüksek Lisans

    Türkçe

    Türkçe

    2011

    Müzikİstanbul Teknik Üniversitesi

    Türk Müziği Ana Sanat Dalı

    DR. NAİL YAVUZOĞLU

  2. Türk müziği enstrümanlarının orkestra eserlerinde ve eğitimdeki yeri

    Place of orchestra in Turkish music instruments and in education

    ALİ SONER AKARSU

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    MüzikNecmettin Erbakan Üniversitesi

    Güzel Sanatlar Eğitimi Ana Bilim Dalı

    PROF. DR. AYNUR ELHAN NAYİR

  3. Geleneksel Türk müziği enstrümanlarının konçertino kullanımlarıyla, konçerto grosso türünde eser çalışması

    New composition as concerto grosso for baroque orchestra and Turkish ensemble

    NAĞME YARKIN

    Sanatta Yeterlik

    Türkçe

    Türkçe

    2019

    Müzikİstanbul Üniversitesi

    Müzik Ana Sanat Dalı

    PROF. EMEL ÇELEBİOĞLU

  4. Mimari akustik değerlendirmeleri için Türk müziği enstrümanlarının yönselliklerinin belirlenmesi

    Determination of directionality of Turkish musical instruments for architectural acoustic evaluations

    YALIN ÖZGENCİL

    Doktora

    Türkçe

    Türkçe

    2023

    MimarlıkYıldız Teknik Üniversitesi

    Mimarlık Ana Bilim Dalı

    PROF. DR. NEŞE AKDAĞ

  5. Orkestra bünyesinde Türk müziği sazları

    Başlık çevirisi yok

    AYHAN GUNCA

    Yüksek Lisans

    Türkçe

    Türkçe

    1999

    Müzikİstanbul Teknik Üniversitesi

    Türk Müziği Ana Sanat Dalı

    DOÇ. MUTLU TORUN