Spektral ters entropi özniteliğinin ağırlıklı bulanık kümelenmesi ile ses verilerinin bölütlenmesi
Segmentation of audio data with weighted fuzzy clustering to attribute of spektral inverse entropy
- Tez No: 365251
- Danışmanlar: YRD. DOÇ. DR. ORHAN KESEMEN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Ses sinyali bölütleme, Bulanık bölütleme, Öznitelik çıkarıma, Audio segmentation, Fuzzy segmentation, Feature extraction
- Yıl: 2014
- Dil: Türkçe
- Üniversite: Karadeniz Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: İstatistik ve Bilgisayar Bilimleri Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 75
Özet
Müzik sesinden elde edilen sayısal ses verileri çok karmaşık yapılar ve çeşitli stiller içermektedir. Bu çalışmadaki amaç, bulanık kümeleme yöntemiyle ses verisini içeriğine göre bölütlere ayırarak her notanın bölgesini kestirmektir. Literatürde bölütleme için geliştirilen birçok yöntem bulunmaktadır. Bu yöntemlerden bazıları; Mel Frekans Kepstrum Katsayıları, Sıfır Geçiş, Fark Fonksiyonların Ortalama Büyüklüğü, Enerji Eşik Değeri Yöntemi, Entropi ve Ayrık Fourier dönüşümü yöntemleridir. Bu yöntemlerden en çok kullanılan yöntem eşik değeri yardımıyla yapılan bölütleme işlemidir. Fakat bu yöntem birçok ses verisi için uygun değildir. Eğer verideki genlik değerleri artan bir fonksiyon oluşturuyorsa, nota bölütleri art arda çalınmaya başlanmışsa ya da notada herhangi bir boğumlanma olmuşsa bu yöntem istenilen verimde bir bölütleme yapamaz. Bu çalışmada bölütleme için uygulanabilecek yeni bir yöntem önerilmiştir. Bu yöntemde ses verisi üzerinde küçük çerçeveler alınarak bir çeşit öznitelik çıkarımı yapılır. Bu öznitelik katsayılarına göre bir bulanık kümeleme uygulanarak bölütleme bölgeleri belirlenir. Böylece seslilik bölgeleri belirlenmiş olur. Bu durumda sessizlik bölgeleri düşük üyelik değerlerinde seslilik kümlerine katılır. Her seslilik bölgesi bulanık bir kümeyle bölütlere ayrılmış olur.
Özet (Çeviri)
The numerical audio data obtained from the music volume involve very complex structures and various styles. The purpose of this paper, is both to separate the audio data into segments based on the content of them using fuzzy clustering method and also to predict the region of each note. In the literature, there are many methods developed for segmentation. Some of these methods are: Mel Frequency Campestral Coefficients, Zero-Crossing, Average Magnitude Difference Function, Energy Threshold Value, Entropy and Discrete Fourier transform methods. The most commonly used method is segmentation process using threshold value. This method cannot segment efficiently in some situations provided that the amplitude of values create an increasing function or musical notes and start to play in succession or any made musical notes fade out. This method cannot desire segmentation efficiency. In this paper, a new method is proposed that uses segmentation. In this method, various feature coefficient extraction is performed by taking small frameworks on the audio data. The regions of the segment are determined using fuzzy clustering according to these feature coefficients, therefore, the silence regions are determined. In this case, silence zones join silence clusters taking low membership values. Therefore, each silence region becomes separated from the segment with a fuzzy cluster.
Benzer Tezler
- Eksik veri için seyrek gösterilimler ile radar görüntüleme
Sparse representation radar imaging in the case of missed data
NİHAT KOYUN
Yüksek Lisans
Türkçe
2019
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
DOÇ. DR. IŞIN ERER
- Derin öğrenme ile süper çözünürlüklü radar görüntüleme
Super resolution radar imaging with deep learning
İREM FADİME ERİM
Yüksek Lisans
Türkçe
2022
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik-Haberleşme Eğitimi Ana Bilim Dalı
PROF. DR. IŞIN ERER
- Rastgele alanların ar modellemesi için dik kafes süzgeci ve spektrum kestirimine uygulanması
Two-dimensional orthogonal lattice structures for autoregressive modeling of random fields and its use in spectrum estimation
SEDAT TÜRE
Yüksek Lisans
Türkçe
1993
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiDOÇ.DR. AHMET H. KAYRAN
- Diferansiyel operatörlerin regülerize izi üzerine
On regularized trace of differantial operators
M.EMİN KÖSEAHMETOĞLU
Yüksek Lisans
Türkçe
2012
MatematikCumhuriyet ÜniversitesiMatematik Ana Bilim Dalı
YRD. DOÇ. DR. YAŞAR ÇAKMAK
- On the inverse dirichlet problem
Ters dirichlet problemi üzerine
ŞİRİN ATILGAN
Yüksek Lisans
İngilizce
1998
MatematikDokuz Eylül ÜniversitesiMatematik Ana Bilim Dalı
PROF. DR. OKTAY VELİEV