Music genre and composer identification by using Kolmogorov distance measure
Müzik tarzı ve bestecisini Kolmogorov uzaklık tanımlarını kullanarak bulma
- Tez No: 166521
- Danışmanlar: PROF. DR. EŞREF ADALI, YRD. DOÇ. DR. ZEHRA ÇATALTEPE
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2005
- Dil: İngilizce
- Üniversite: İstanbul Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 105
Özet
MÜZİK TARZINI VE BESTECİSİNİ KOLMOGOROV UZAKLIK TANIMLARININ KULLANIMI İLE BULMA ÖZET Vitanyi ve çalışma arkadaştan müzik parçalarını, bestecilerine ve tarzlarına göre demetlemek için Kolmogorov mesafesinin kullanılabileceği hipotezini ortaya atmışlardı. Hipotez DNA dizilerinden Internet sayfa tasarımlarına kadar katar tarzında ifade edilebilen her türlü veri ile Kolmogorov mesafesini kullanmanın mümkün olduğunu da bildiriyordu. Vitanyi ve çalışma arkadaşları analiz ettikleri müzik parçalan için MIDI [www.classicalmidiresource.com] formatındaki dosyalan seçmişlerdir. MIDL bir çok müzik elektronik müzik aletinin birbiriyle etkileşimini düzenleyen ve yaygın olarak kullanılan bir standarttır. MIDI dosyalan, sayısal ses dosyalarının aksine kaydedilmiş müzik kayıtlarını içermez. Bunun yerine müziğin nasıl çalınması gerektiğini belirten komut dizilerini içerir. Bir MIDI dosyasında eş zamanlı olarak tek bir nota çalan enstrümanlar (Ör: Flüt) bulunabileceği gibi birden fazla nota çalabilen enstrümanlar (Ör: Piyano) da bulunabilir. Ayrıca aynı anda birden fazla eser ve kanal da aktif olabilmektedir. Her bir MIDI dosyası ön işlemeden geçirildi ve katar şeklinde gösterilim elde edildi.Her bir notanın O ile 127 arasında bir sayı değerine karşılık düşürülmesi sebebiyle biz bu gösterilimi matematiksel gösterilim olarak ifade edeceğiz. Vitanyi ve çalışma arkadaşları müzik parçalarının matematiksel gösterilişleri arasında NCD (İndirgenmiş Sıkıştırma Mesafesi) hesaplamışlardır. NCD parçalar arasındaki Kolmogorov Mesafesi' nin bir yaklaşımı olarak nitelendirilebilir. Kolmogorov mesafesi ise her bir parçanın matematiksel gösterilişinin Kolmogorov Karmaşıklığı'na doğrudan bağımlıdır. Kolmogorov Karmaşıklığı, katarın içerdiği bilgi miktarını o katan elde edebilecek en kısa uzunluktaki program parçasının boyutuna bakarak ölçmektedir. NCD kullanılarak, verilmiş olan müzik parçalan kümesinde mesafe matrisi hesaplanabilir. Vitanyi ve çalışma arkadaşları NCD kullanılarak müzik parçalarının tarz ve bestecilerinin demetlenebileceğim Quartet metodunu kullanarak göstermeye çalışmışlardır. Demetleme algoritması 0(n4) mertebesinde zaman karmaşıklığı olması sebebiyle çok büyük veri kümelerinde çok fazla zaman almaktadır. Bu sebeple Vitanyi ve arkadaşları sadece küçük veri kümeleri ile yaptıkları deneyleri bildirmişlerdir. Aynı zamanda veri kümesindeki eleman sayısı arttıkça demetleme başarının düştüğünü de bildirmişlerdir. Bu tezde öncelikle müzik parçalarının matematiksel gösterilişlerinin farklı MIDI ön XVişleme metotları kullanıldığında başarımı incelenmiştir. NCD kullanılarak elde edilmiş mesafe matrisi k-NN (k-En yakın komşu) algoritması ile test edilerek ilgili metotların başarımı ölçülmüştür. Farklı MIDI ön işleme teknikleri 4 farklı parametre üzerinde incelenmiştir: i) MIDI dosyasının analizinde kullanılan zaman aralığı(l, 5, 10,..., ms). ii) Parçanın çok sesli(Her zaman aralığında birden fazla nota) yada tek sesli(Her zaman aralığında sadece tek nota) olarak gösterilimi, iii) Tek sesli gösterilim için bir önceki zaman aralığında geçerli nota ile arasındaki farkın mı yoksa notanın kendi değerinin mi kullanıldığı, iv) Nota değerlerinden çıkartılacak iki farklı matematiksel modun hangisinin kullanıldığı. MIDI dosyalarında“Note on”ve "Note off' komutları bulunmaktadır. Seçilen örnekleme zaman dilimlerinin her birinde hangi notaların etkin olarak ses verdiği hesaplanmaktadır. Her bir notaya 0 ile 127 arasında bir sayı ataması yapılmaktadır. Matematiksel mod (mod nota A) tüm parçada geçen notalar değerlendirilerek bulunmaktadır. Çok sesliden tek sesliye geçiş işlemi yapılmadığında nota değerinden mod çıkartılmakta ve bu değer bir dosyaya yazılmaktadır. Tek sesli gösterilim seçildiğinde aynı anda etkin olan notalardan en yüksek oktavlı olan nota seçilmektedir. Bundan sonra her bir zaman aralığında etkin olan notaların tamamı değerlendirilerek matematiksel mod(mod nota B) hesaplanmaktadır. Eğer notalar arasındaki fark seçimini kullanmamayı seçmişsek her bir zaman aralığı için geçerli notadan mod nota değeri çıkartılmakta ve sonuç değeri dosyaya yazılmaktadır, aksi halde ise art arda gelen geçerli notaların farkı dosyaya yazılmaktadır. Kullandığımız değişik modelleme tekniklerinin ve NCD'nin doğruluğunun ölçülmesi amacıyla besteci ve tarz sınıflandırılması üzerine deneyler yaptık. Vitanyi ve arkadaşlarından farklı olarak kullanılan müzik parçalarının isimleri parçayı tanımlayacak şekilde bıraktık. Eğitici küme ve Complearn algoritması ile hesaplanan mesafe matrisi kullanımıyla k-En yakın komşu sınırlandırıcıları ile test kümesi üzerinde ( k=l ve k=3) sınıflandırma yaptık. Besteci sınıflandırması için kullandığımız veri kümesi Bach, Chopin ve Debussy'den 20'şer parça içermektedir. Müzik tarzı için kullandığımız veri kümelerinden biri 20 Klasik, 20 Türk, 20 îran parçası, diğeri klasik, caz ve ağır metal parçalan içermektedir. Deneylerimiz sonucunda NCD ve k-En Yakın Komşu algoritmasının hem besteci hem de tarz sınıflandırma konularında gayet iyi sonuçlar verdiğini gördük, %90'lara varan başarımın sağlanması yapılan çalışmanın tahmin seviyesinden ne kadar uzakta olduğunu göstermektedir. Bu çalışma sonucunda örnekleme periyodunun sınıflandırma başarınında önemli etkisi olduğu gösterilmiş oldu. Birbiri ardına gelen notalar arasındaki farkların kullanılması sonucu sınıflandırmanın başarının arttığı görüldü. Çalışma sonucunda vardığımız bir başka sonuç ise NCD'nin eğitim kümesindeki eleman sayısı arttıkça daha iyi başarım sağlamasıydı. Bu çalışma müziksel veritabanlarında binlerce müzik parçasının bulunduğu göz önünde bulundurulduğunda, NCD'nin gerçek Müzik Bilgi Sistemleri'nde kullanılabileceğini göstermiştir. xvı
Özet (Çeviri)
MUSIC GENRE AND COMPOSER IDENTIFICATION BY USING KOLMOGOROV DISTANCE MEASURE SUMMARY Recently Vitanyi and his colleagues have suggested using an approximation to Kolmogorov distance as a means to compute clusters of music. The approach is quite flexible and can be used on any kind of data that can be represented in string form, from DNA sequences to web pages. Vitanyi and his colleagues use MIDI [www.cIassicaImidiresource.com] files as the starting point of the music pieces they analyze. MIDI (Musical Instrument Digital Interface) allows various electronic musical instruments to interact with each other in a standard way. Unlike digital audio files, MIDI files do not contain actual recorded music. Instead, the music sequence is recorded as a series of numbers which explain how the music is to be played back. In a midi file each instrument can play a single (for example flute) or multiple (for example piano) notes at the same instance. There are also multiple tracks and channels that are active at the same time. Each MIDI file is preprocessed and represented as a string. Since each note is represented using a number from 0 to 127, we call this representation the mathematical representation of the music piece. Vitanyi and colleagues, calculate the NCD (Normalized Compression Distance) between the mathematical representations of music pieces. NCD is based on an approximation of the Kolmogorov Distance between the pieces. The Kolmogorov Distance depends on the Kolmogorov Complexity of each representation. The Kolmogorov Complexity measures the amount of information in a string by the size of the smallest program generating that string. Given a set of music pieces, the distance matrix between them can be computed using the NCD. Vitanyi and colleagues use Quartet Method of clustering to show that NCD gives meaningful results for genre and composer clustering of music pieces. The clustering algorithm has 0(n4) time complexity and takes a very long time for large data sets, they report results for small data sets only. They also report that the clustering performance decreases as more data is included in the data set In this thesis we first investigate different MIDI preprocessing techniques to form the mathematical representations of music pieces. Then, we use a classification algorithm (k-nearest-neighbor), using NCD as the distance metric, to assess the performance of NCD and the particular preprocessing technique. xvuWe investigate different preprocessing techniques based on four different aspects: i) The length of time interval (1, 5, 10,..., ms) using which we analyze the MIDI file, ii) Whether we represent the music piece as a polyphonic (multiple notes at each time interval) or monophonic (single note at each time interval) piece, iii) For monophonic representation whether we take the difference between notes at each time interval or we use the actual value of the notes at each time interval, iv) Two different kinds of mathematical modal note to subtract from the note values. The MIDI file contains note on and off events. We decide on the sampling time interval length and determine which notes fall into each time interval. We convert each note into a number from 0 to 127. We compute the mathematical mode (modal note A) of all the notes we find in all time intervals. When we do not do monophonic conversion, we subtract the modal note from all the note values and write them into a file to obtain the mathematical representation. When we use monophonic representation, we map the notes at each time interval into a single note. We choose the note with the maximum pitch. We then compute the mathematical mode (modal note B) of the notes for each time interval. If we have chosen not to take the difference between notes, we output the numbers which are calculated by subtracting the modal note (A or B) from the notes at each time interval. Otherwise, we take the difference between notes at each time interval and output these numbers as the mathematical representation. In order to estimate the accuracy of a particular preprocessing method and NCD, we use the genre or composer test classification accuracy. Unlike Vitanyi and colleagues, we use the data with labels that tell us the genre or composer of each music piece. Based on training data and the distances computed by the complearn algorithm, we obtain a k- Nearest-Neighbor classifier. We compare performance of k=l and k=3 Nearest- Neighbor classifiers on a test set The data set we use for composer classification consists of 20 pieces each from Bach, Debussy and Chopin. One data set we use for genre classification consists of 20 classical, 20 Turkish and 20 Iranian and the other data set consists of classical, jazz and heavy metal pieces. In our experiments we find out that the NCD and k-Nearest-Neighbor work well for composer and genre classification. We get accuracy rates of up to 90%, which is too far from guessing. We find out mat the sampling time interval length makes a difference on the classification performance. We also find out that taking the difference between consecutive monophonic notes improves classification. Another conclusion we reach is that the NCD measure works better as more training data is available. Since usually there are a lot of (thousands) songs in typical musical databases, this is promising for the use of NCD on real musical information retrieval xvsr
Benzer Tezler
- Anatomy of Bosnian war songs: Narrative analyses of wartime songs in Bosnia and Herzegovina 1992-1995
Bosna savaş şarkılarının anatomisi: 1992-1995 yılları arasında Bosna Hersek savaş şarkılarının anlatımsal analizi
KAAN SANCAKTAR
Yüksek Lisans
İngilizce
2024
Müzikİstanbul Teknik ÜniversitesiMüzikoloji ve Müzik Teorisi Ana Bilim Dalı
PROF. DR. OZAN BAYSAL
- Virtual agency in Béla Bartók's night music compositions
Béla Bartók'un gece müziği bestelerinde sanal eylemlilik
KAAN MUZAFFER BIYIKOĞLU
- Türkiye'de müslümanların dini günleriyle ilgili eserlerin besteciliği ve icraları
The composition and performances of the works related to religious days of muslims in Turkey
MUSTAFA EFE KAŞIKÇIOĞLU
Doktora
Türkçe
2021
MüzikSüleyman Demirel Üniversitesiİslam Tarihi ve Sanatları Ana Bilim Dalı
DR. ÖĞR. ÜYESİ CENK CELASİN
- Kemani bestekâr Tatyos Efendi tarafından bestelenen saz semâîlerinin tür ve biçim analizi ve Türk müziği keman icraları için çalışma kılavuzu önerisi
Genre and form analysis of saz semai, composed by violin composer Tatyos Efendi, and a study guide for Turkish music violin performances
MUHAMMED MUSTAFA ÇALIŞ
Yüksek Lisans
Türkçe
2023
MüzikEge ÜniversitesiTürk Müziği Ana Bilim Dalı
DOÇ. DR. ESİN DE THORPE MILLARD