Clustering of manifold-modeled data based on tangent space variations
Manifold modelli datanın tanjant uzayı değişikliklerine dayalı kümelenmesi
- Tez No: 474844
- Danışmanlar: YRD. DOÇ. DR. ELİF VURAL
- Tez Türü: Yüksek Lisans
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2017
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 78
Özet
Son yılların önemli bir araştırma konusu, kümeleme ve sınıflandırma uygulamaları için veri kümelerini anlamak ve analiz etmektir. Birçok veri analizi probleminde, eldeki veri setleri özünde düşük boyutlu bir yapıya sahiptir ve bu yapı manifold modeli olarak kabul edilir. Doğrusal olmayan düşük boyutlu yapılar için geliştirilen en gelişkin kümeleme yöntemlerinden çoğu yerel doğrusallık varsayımlarına dayanır. Ancak, yerel doğrusal gösterimlere dayalı kümeleme algoritmaları, örnekleme koşullarının kötü olduğu durumları sadece bir dereceye kadar tolere edebilir ve az örneklenen manifoldlarda veya yüksek eğimli bölgelerde başarısız olabilir. Bu tezde, her bir kümenin bir manifold etrafında yoğunlaştığı ve tanjant uzayı değişiminin aynı manifolddaki eğriler boyunca tutarlı olması gerektiği gözlemine dayanan bir manifold kümeleme algoritması öneriyoruz. Manifold modelli veri kümelerinin doğrusal olmayan geometrik yapısının, bütün manifold üzerindeki tanjant alan değişimini gözleyerek elde ettiğimiz verinin küresel geometri bilgisini dikkate alarak daha iyi kavranabileceğini savunuyoruz. İlk olarak, sınırlı bir eğime sahip manifoldların bazı özelliklerini teorik olarak karakterize ettik. Daha sonra bu gözlemleri, geometri temelli bir kümeleme yaklaşımı geliştirmek için kullandık. Son olarak, önerdiğimiz yöntemin performansını, gerçek ve sentetik veri setleri ile yapılan deneyler ile değerlendirdik. Sonuçlar, bazı tür veri kümelerinde yöntemimizin Öklit uzaklık, jeodezik uzaklık ve seyrek gösterime dayalı yöntemlerden daha başarılı olduğunu gösterdi. Çalışmamız, geometri tabanlı benzerlik ölçütlerinin, temelinde düşük boyutlu bir yapıya sahip olan veri kümelerinin kümelenmesi için umut verici olduğunu önermektedir.
Özet (Çeviri)
An important research topic of the recent years has been to understand and analyze data collections for clustering and classification applications. In many data analysis problems, the data sets at hand have an intrinsically low-dimensional structure and admit a manifold model. Most state-of-the-art clustering methods developed for data of non-linear and low-dimensional structure are based on local linearity assumptions. However, clustering algorithms based on locally linear representations can tolerate difficult sampling conditions only to some extent, and may fail for scarcely sampled data manifolds or at high-curvature regions. In this thesis, we consider a setting where each cluster is concentrated around a manifold and propose a manifold clustering algorithm that relies on the observation that the variation of the tangent space must be consistent along curves over the same data manifold. We argue that the non linear geometric structure of manifold-modeled data sets can be better handled by taking into account the global data geometry via the change in the tangent space over the whole manifold. We first theoretically characterize some properties of manifolds of bounded curvature. We then use these observations to develop a geometry-based clustering approach. Finally, we evaluate the performance of the presented method with experiments on synthetic and real data sets and the results show that the proposed method outperforms the manifold clustering algorithms in comparison based on Euclidean distance, geodesic distance and sparse representations in some kind of data sets. Our study suggests that geometry-based dissimilarity measures can provide promising tools for the clustering of intrinsically low dimensional data sets.
Benzer Tezler
- Semantik bilginin analizi ve modellenmesi
Analysis and modeling of semantic information
SELMA TEKİR
Doktora
Türkçe
2010
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEge ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. AHMET KOLTUKSUZ
PROF. DR. ŞABAN EREN
- Approximate spectral clustering ensemble methods for clustering of large data sets
Büyük veri kümelerinin sınıflandırılmasında yaklaşık spektral öbekleme birleşimi yöntemleri
YASER MOAZZEN
Yüksek Lisans
İngilizce
2016
Bilim ve Teknolojiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
DOÇ. DR. İSA YILDIRIM
DOÇ. DR. KADİM TAŞDEMİR
- Dendritic spine shape analysis based on two-photon microscopy images
İki foton mikroskobik görüntüleri kullanarak dendritik diken şekil analizi
MUHAMMAD USMAN GHANI
Yüksek Lisans
İngilizce
2016
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSabancı ÜniversitesiBilgisayar Bilimleri Ana Bilim Dalı
DOÇ. DR. MÜJDAT ÇETİN
- Compression of geometry videos by 3D-SPECK wavelet coder
Geometri videolarının 3D-SPECK wavelet kodlayıcı ile kodlanması
CANAN GÜLBAK BAHÇE
Doktora
İngilizce
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. ULUĞ BAYAZIT
- Online embedding and clustering of evolving data streams
Değişken veri akışlarının çevrimiçi boyutsal küçültülmesi ve kümelenmesi
ALAETTİN ZUBAROĞLU
Doktora
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. MEHMET VOLKAN ATALAY