Geri Dön

Spektral ters entropi özniteliğinin ağırlıklı bulanık kümelenmesi ile ses verilerinin bölütlenmesi

Segmentation of audio data with weighted fuzzy clustering to attribute of spektral inverse entropy

  1. Tez No: 365251
  2. Yazar: NASİM JABBARİ
  3. Danışmanlar: YRD. DOÇ. DR. ORHAN KESEMEN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Ses sinyali bölütleme, Bulanık bölütleme, Öznitelik çıkarıma, Audio segmentation, Fuzzy segmentation, Feature extraction
  7. Yıl: 2014
  8. Dil: Türkçe
  9. Üniversite: Karadeniz Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik ve Bilgisayar Bilimleri Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 75

Özet

Müzik sesinden elde edilen sayısal ses verileri çok karmaşık yapılar ve çeşitli stiller içermektedir. Bu çalışmadaki amaç, bulanık kümeleme yöntemiyle ses verisini içeriğine göre bölütlere ayırarak her notanın bölgesini kestirmektir. Literatürde bölütleme için geliştirilen birçok yöntem bulunmaktadır. Bu yöntemlerden bazıları; Mel Frekans Kepstrum Katsayıları, Sıfır Geçiş, Fark Fonksiyonların Ortalama Büyüklüğü, Enerji Eşik Değeri Yöntemi, Entropi ve Ayrık Fourier dönüşümü yöntemleridir. Bu yöntemlerden en çok kullanılan yöntem eşik değeri yardımıyla yapılan bölütleme işlemidir. Fakat bu yöntem birçok ses verisi için uygun değildir. Eğer verideki genlik değerleri artan bir fonksiyon oluşturuyorsa, nota bölütleri art arda çalınmaya başlanmışsa ya da notada herhangi bir boğumlanma olmuşsa bu yöntem istenilen verimde bir bölütleme yapamaz. Bu çalışmada bölütleme için uygulanabilecek yeni bir yöntem önerilmiştir. Bu yöntemde ses verisi üzerinde küçük çerçeveler alınarak bir çeşit öznitelik çıkarımı yapılır. Bu öznitelik katsayılarına göre bir bulanık kümeleme uygulanarak bölütleme bölgeleri belirlenir. Böylece seslilik bölgeleri belirlenmiş olur. Bu durumda sessizlik bölgeleri düşük üyelik değerlerinde seslilik kümlerine katılır. Her seslilik bölgesi bulanık bir kümeyle bölütlere ayrılmış olur.

Özet (Çeviri)

The numerical audio data obtained from the music volume involve very complex structures and various styles. The purpose of this paper, is both to separate the audio data into segments based on the content of them using fuzzy clustering method and also to predict the region of each note. In the literature, there are many methods developed for segmentation. Some of these methods are: Mel Frequency Campestral Coefficients, Zero-Crossing, Average Magnitude Difference Function, Energy Threshold Value, Entropy and Discrete Fourier transform methods. The most commonly used method is segmentation process using threshold value. This method cannot segment efficiently in some situations provided that the amplitude of values create an increasing function or musical notes and start to play in succession or any made musical notes fade out. This method cannot desire segmentation efficiency. In this paper, a new method is proposed that uses segmentation. In this method, various feature coefficient extraction is performed by taking small frameworks on the audio data. The regions of the segment are determined using fuzzy clustering according to these feature coefficients, therefore, the silence regions are determined. In this case, silence zones join silence clusters taking low membership values. Therefore, each silence region becomes separated from the segment with a fuzzy cluster.

Benzer Tezler

  1. Eksik veri için seyrek gösterilimler ile radar görüntüleme

    Sparse representation radar imaging in the case of missed data

    NİHAT KOYUN

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    DOÇ. DR. IŞIN ERER

  2. Derin öğrenme ile süper çözünürlüklü radar görüntüleme

    Super resolution radar imaging with deep learning

    İREM FADİME ERİM

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik-Haberleşme Eğitimi Ana Bilim Dalı

    PROF. DR. IŞIN ERER

  3. Rastgele alanların ar modellemesi için dik kafes süzgeci ve spektrum kestirimine uygulanması

    Two-dimensional orthogonal lattice structures for autoregressive modeling of random fields and its use in spectrum estimation

    SEDAT TÜRE

    Yüksek Lisans

    Türkçe

    Türkçe

    1993

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    DOÇ.DR. AHMET H. KAYRAN

  4. Diferansiyel operatörlerin regülerize izi üzerine

    On regularized trace of differantial operators

    M.EMİN KÖSEAHMETOĞLU

    Yüksek Lisans

    Türkçe

    Türkçe

    2012

    MatematikCumhuriyet Üniversitesi

    Matematik Ana Bilim Dalı

    YRD. DOÇ. DR. YAŞAR ÇAKMAK

  5. On the inverse dirichlet problem

    Ters dirichlet problemi üzerine

    ŞİRİN ATILGAN

    Yüksek Lisans

    İngilizce

    İngilizce

    1998

    MatematikDokuz Eylül Üniversitesi

    Matematik Ana Bilim Dalı

    PROF. DR. OKTAY VELİEV