Iterative estimation of robust Gaussian mixture models in heterogeneous data sets
Gauss karışım modellerinin türdeş olmayan veri öbeklerinde yinelemeli kestirimi
- Tez No: 360924
- Danışmanlar: DOÇ. DR. SELİM AKSOY
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2014
- Dil: İngilizce
- Üniversite: İhsan Doğramacı Bilkent Üniversitesi
- Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 87
Özet
Verilerden olasılık yoğunluk fonksiyonu parametrelerini kestirme işlemine yoğunluk kestirimi denir. Gauss karışım modeli (GKM) en çok tercih edilen yoğunluk ailelerinden biridir. Gauss karışımlarından örneklenmiş ilginç noktalar ile Gauss dağılımına sahip olmayan ilginç olmayan noktalardan oluşan veri öbeklerinden Gauss karısım kestiriminin nasıl yapıldığını inceliyoruz. Expectation-Maximization algoritması gibi geleneksel GKM kestirim teknikleri, ilginç olmayan noktalara olan hassaslığından dolayı, türdeş olmayan verilerdeki ilginç noktaları etkin olarak modelleyememektedir. Bir diğer olası sorun ise, iyi bir kestirim yapılabilmesi için ̈oncesinde gerçek bileşen sayısının genellikle bilinmesinin gerektiğidir. Biz, ilginç olmayan noktaların varlığına karşı sağlam, ilginç noktaların sayısını, karışımdaki Gauss sayısını ve gerçek karışım parametrelerini yinelemeli kestiren bir GKM kestirim algoritması tasarlıyoruz. Yöntemimiz, her yinelemede bir Gauss bileşenini sağlam bir formulasyonla kestirir. Bu bileşene ait ilginç nokta sayısı, çoklu-çözünürlük arama yöntemi kullanılarak adaylar arasından kestirilir. Eğer bu noktaların Gauss dağılımından gelme hipotezi kabul edilirse, kestirilen Gauss, karışım bileşeni olarak tutulur, ilgili noktalar veri öbeğinden ̧cıkarılır ve yinelemeler kalan noktalarla devam eder. Aksi durumda, kestirim süreci durdurulur ve kalan noktalar ilginç olmayan şeklinde etiketlenir. Bu ̧sekilde, durdurma kriteri herhangi ek bir bilgi olmadan gerçek bileşen sayısını belirler. Sentetik ve gerçek-ddünya veri öbekleri üzerinden yapılan karşılaştırmalı deneyler gösteriyor ki, algoritmamız gerçek bileşen sayısını belirleyebiliyor ve diğer iki algoritmaya göre daha iyi yoğunluk kestirimi yapabiliyor.
Özet (Çeviri)
Density estimation is the process of estimating the parameters of a probability density function from data. The Gaussian mixture model (GMM) is one of the most preferred density families. We study the estimation of a Gaussian mixture from a heterogeneous data set that is defined as the set of points that contains interesting points that are sampled from a mixture of Gaussians as well as non-Gaussian distributed uninteresting ones. The traditional GMM estimation techniques such as the Expectation-Maximization algorithm cannot effectively model the interesting points in a heterogeneous data set due to their sensitivity to the uninteresting points as outliers. Another potential problem is that the true number of components should often be known a priori for a good estimation. We propose a GMM estimation algorithm that iteratively estimates the number of interesting points, the number of Gaussians in the mixture, and the actual mixture parameters while being robust to the presence of uninteresting points in heterogeneous data. The procedure is designed so that one Gaussian component is estimated using a robust formulation at each iteration. The number of interesting points that belong to this component is also estimated using a multi-resolution search procedure among a set of candidates. If a hypothesis on the Gaussianity of these points is accepted, the estimated Gaussian is kept as a component in the mixture, the associated points are removed from the data set, and the iterations continue with the remaining points. Otherwise, the estimation process is terminated and the remaining points are labeled as uninteresting. Thus, the stopping criterion helps to identify the true number of components without any additional information. Comparative experiments on synthetic and real-world data sets show that our algorithm can identify the true number of components and can produce a better density estimate in terms of log-likelihood compared to two other algorithms.
Benzer Tezler
- Doğal süreçlerde gürültü analizi ve sinyal modellemeleri
Noise analysis and signal modeling in natural processes
SÜLEYMAN BAYKUT
Doktora
Türkçe
2012
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. TAYFUN AKGÜL
- Mikrofon dizilerinde ses kaynağının yerinin zaman farkı gecikmeleri kullanılarak bulunması
Sound source localization using microphone arrays by tdoa method
BİLGE MİNİSKER
Yüksek Lisans
Türkçe
2018
Mühendislik Bilimleriİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
DOÇ. MÜRVET KIRCI
- A video surveillance system based on interacting multiple models
Etkileşimli çoklu modellere dayalı video gözetim sistemi
CEREN SARITAŞ
Yüksek Lisans
İngilizce
2010
Elektrik ve Elektronik MühendisliğiYeditepe ÜniversitesiElektrik ve Elektronik Mühendisliği Bölümü
DOÇ. DR. CEM ÜNSALAN
- Nonlinear state and parameter estimation of the hemodynamic model using fMRI bold signal
Hemodinamik modelin fMRI bold sinyali kullanarak doğrusal olmayan durum ve parametre tahmini
SERDAR ASLAN
Doktora
İngilizce
2015
BiyomühendislikBoğaziçi ÜniversitesiBiyomedikal Mühendisliği Ana Bilim Dalı
PROF. DR. AHMET ADEMOĞLU
PROF. DR. ATA AKIN
- Efficient techniques for the single-frame super-resolution reconstruction of intensity images
Tek imgeden süper-çözünürlüklü geri-çatma amacıyla geliştirilmiş etkin yöntemler
AYDIN AKYOL
Doktora
İngilizce
2012
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. MUHİTTİN GÖKMEN