Geri Dön

Clustering of manifold-modeled data based on tangent space variations

Manifold modelli datanın tanjant uzayı değişikliklerine dayalı kümelenmesi

  1. Tez No: 474844
  2. Yazar: GÖKHAN GÖKDOĞAN
  3. Danışmanlar: YRD. DOÇ. DR. ELİF VURAL
  4. Tez Türü: Yüksek Lisans
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2017
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 78

Özet

Son yılların önemli bir araştırma konusu, kümeleme ve sınıflandırma uygulamaları için veri kümelerini anlamak ve analiz etmektir. Birçok veri analizi probleminde, eldeki veri setleri özünde düşük boyutlu bir yapıya sahiptir ve bu yapı manifold modeli olarak kabul edilir. Doğrusal olmayan düşük boyutlu yapılar için geliştirilen en gelişkin kümeleme yöntemlerinden çoğu yerel doğrusallık varsayımlarına dayanır. Ancak, yerel doğrusal gösterimlere dayalı kümeleme algoritmaları, örnekleme koşullarının kötü olduğu durumları sadece bir dereceye kadar tolere edebilir ve az örneklenen manifoldlarda veya yüksek eğimli bölgelerde başarısız olabilir. Bu tezde, her bir kümenin bir manifold etrafında yoğunlaştığı ve tanjant uzayı değişiminin aynı manifolddaki eğriler boyunca tutarlı olması gerektiği gözlemine dayanan bir manifold kümeleme algoritması öneriyoruz. Manifold modelli veri kümelerinin doğrusal olmayan geometrik yapısının, bütün manifold üzerindeki tanjant alan değişimini gözleyerek elde ettiğimiz verinin küresel geometri bilgisini dikkate alarak daha iyi kavranabileceğini savunuyoruz. İlk olarak, sınırlı bir eğime sahip manifoldların bazı özelliklerini teorik olarak karakterize ettik. Daha sonra bu gözlemleri, geometri temelli bir kümeleme yaklaşımı geliştirmek için kullandık. Son olarak, önerdiğimiz yöntemin performansını, gerçek ve sentetik veri setleri ile yapılan deneyler ile değerlendirdik. Sonuçlar, bazı tür veri kümelerinde yöntemimizin Öklit uzaklık, jeodezik uzaklık ve seyrek gösterime dayalı yöntemlerden daha başarılı olduğunu gösterdi. Çalışmamız, geometri tabanlı benzerlik ölçütlerinin, temelinde düşük boyutlu bir yapıya sahip olan veri kümelerinin kümelenmesi için umut verici olduğunu önermektedir.

Özet (Çeviri)

An important research topic of the recent years has been to understand and analyze data collections for clustering and classification applications. In many data analysis problems, the data sets at hand have an intrinsically low-dimensional structure and admit a manifold model. Most state-of-the-art clustering methods developed for data of non-linear and low-dimensional structure are based on local linearity assumptions. However, clustering algorithms based on locally linear representations can tolerate difficult sampling conditions only to some extent, and may fail for scarcely sampled data manifolds or at high-curvature regions. In this thesis, we consider a setting where each cluster is concentrated around a manifold and propose a manifold clustering algorithm that relies on the observation that the variation of the tangent space must be consistent along curves over the same data manifold. We argue that the non linear geometric structure of manifold-modeled data sets can be better handled by taking into account the global data geometry via the change in the tangent space over the whole manifold. We first theoretically characterize some properties of manifolds of bounded curvature. We then use these observations to develop a geometry-based clustering approach. Finally, we evaluate the performance of the presented method with experiments on synthetic and real data sets and the results show that the proposed method outperforms the manifold clustering algorithms in comparison based on Euclidean distance, geodesic distance and sparse representations in some kind of data sets. Our study suggests that geometry-based dissimilarity measures can provide promising tools for the clustering of intrinsically low dimensional data sets.

Benzer Tezler

  1. Semantik bilginin analizi ve modellenmesi

    Analysis and modeling of semantic information

    SELMA TEKİR

    Doktora

    Türkçe

    Türkçe

    2010

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEge Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. AHMET KOLTUKSUZ

    PROF. DR. ŞABAN EREN

  2. Approximate spectral clustering ensemble methods for clustering of large data sets

    Büyük veri kümelerinin sınıflandırılmasında yaklaşık spektral öbekleme birleşimi yöntemleri

    YASER MOAZZEN

    Yüksek Lisans

    İngilizce

    İngilizce

    2016

    Bilim ve Teknolojiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    DOÇ. DR. İSA YILDIRIM

    DOÇ. DR. KADİM TAŞDEMİR

  3. Dendritic spine shape analysis based on two-photon microscopy images

    İki foton mikroskobik görüntüleri kullanarak dendritik diken şekil analizi

    MUHAMMAD USMAN GHANI

    Yüksek Lisans

    İngilizce

    İngilizce

    2016

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSabancı Üniversitesi

    Bilgisayar Bilimleri Ana Bilim Dalı

    DOÇ. DR. MÜJDAT ÇETİN

  4. Compression of geometry videos by 3D-SPECK wavelet coder

    Geometri videolarının 3D-SPECK wavelet kodlayıcı ile kodlanması

    CANAN GÜLBAK BAHÇE

    Doktora

    İngilizce

    İngilizce

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. ULUĞ BAYAZIT

  5. Online embedding and clustering of evolving data streams

    Değişken veri akışlarının çevrimiçi boyutsal küçültülmesi ve kümelenmesi

    ALAETTİN ZUBAROĞLU

    Doktora

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. MEHMET VOLKAN ATALAY