Geri Dön

Clustering based on hyperplanes

Hiperdüzlem tabanlı topaklama

  1. Tez No: 763023
  2. Yazar: EDWARD CHOME
  3. Danışmanlar: PROF. DR. HAKAN ÇEVİKALP
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: İngilizce
  9. Üniversite: Eskişehir Teknik Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Bilimleri Bilim Dalı
  13. Sayfa Sayısı: 98

Özet

Makine öğrenimi alanında topaklama çok önemli problemlerden biridir. Bu bağlamda çok çeşitli yaklaşımlar kullanılarak birçok topaklama algoritması önerilmiştir. Bu çalışmada, yüksek boyutlu veri topaklamaye odaklanılmış ve maksimum marj topaklama yaklaşımı kullanılmıştır. Bu amaçla iki yöntem önerilmiştir: İlk önerilen yöntemde, klasik maksimum marj topaklama yaklaşımı kullanılmıştır ve verileri aralarında en büyük marj ile iki kümeye bölen bir yöntem önerilmiştir. İkinci yöntemde ise topaklama da küme kompaktlığı dikkate alınmış ve küme örneklerine en iyi uyan ancak aynı zamanda birbirinden mümkün olduğunca uzak iki paralel hiperdüzlem bulunmuştur. Ek olarak, bu topaklama yöntemlerinin aykırı değerlere ve veri örnekleri içindeki gürültüye karşı daha dayanıklı olan varyantları tanıtılmıştır. Ortaya çıkan optimizasyon problemlerini çözmek için stokastik gradyan (SG) algoritmasını kullanılmıştır. Bu nedenle önerilen tüm topaklama yöntemleri büyük ölçekli verilerle hızlı çalışacak niteliktedir. Deneysel sonuçlar, önerilen yöntemlerin, özellikle yüksek boyutlu topaklama problemlerinde, literatürde bulunan diğer maksimum marjlı topaklama yöntemlerine kıyasla daha iyi performans gösterdiğini göstermektedir.

Özet (Çeviri)

In machine learning, clustering is of pivotal importance and there is a growing research interest directed towards it. Many clustering algorithms have been proposed using a wide range of approaches. In this study, we focus on high-dimensional data clustering and adopt the maximum margin clustering approach. To this end, we introduced two methods: The first proposed method uses the classical maximum margin clustering approach, and it splits the data into two clusters with the largest margin between them. The second proposed method takes the cluster compactness into consideration, and it searches for two parallel hyperplanes that best fit the cluster samples but at the same time as far as possible from each other. In addition, we introduced the variants of these clustering methods that are more robust to the outliers and noise within the data samples. We use the stochastic gradient (SG) algorithm to solve the resulting optimization problems, therefore all proposed clustering methods scale well with large-scale data. The experimental results show that the proposed methods significantly outperform the existing maximum margin clustering methods, especially on high-dimensional clustering problems, which shows the efficacy of the proposed methods.

Benzer Tezler

  1. Clustering and profiling scholars based on publication performance in bibliographic databases: A case of Turkey

    Bibliyografik veritabanlarını kullanarak yayın performansına göre bilim insanlarının kümelenmesi ve profil oluşturma: Türkiye örneği

    ALİ PİŞİRGEN

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Yönetim Bilişim SistemleriİZMİR BAKIRÇAY ÜNİVERSİTESİ

    Yönetim Bilişim Sistemleri Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ SERHAT PEKER

  2. Tip-2 bulanık kümelemeye dayalı parametre tahmini

    Parameter estimation based on type-2 fuzzy clustering

    SEDA SAĞIRKAYA

    Yüksek Lisans

    Türkçe

    Türkçe

    2017

    İstatistikKaradeniz Teknik Üniversitesi

    İstatistik ve Bilgisayar Bilimleri Ana Bilim Dalı

    PROF. DR. TÜRKAN ERBAY DALKILIÇ

  3. Memory efficient online hierarchical clustering based on undersampling

    Örneklemeye dayalı hafıza verimli çevirimiçi hiyerarşik kümeleme

    SAMED ARSLAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBahçeşehir Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. CEMAL OKAN ŞAKAR

  4. Clustering based diversity improvement in recommender systems

    Tavsiye sistemlerinde kümeleme algoritması kullanarak çeşitliliğin geliştirilmesi

    MAHMUT ÖZGE KARAKAYA

    Yüksek Lisans

    İngilizce

    İngilizce

    2012

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBahçeşehir Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. TEVFİK AYTEKİN

  5. A methodology of swarm intelligence application in clustering based on neighborhood construction

    Kümelemede komşuluk kurmaya dayalı sürü zekası uygulama metodolojisi

    TÜLİN İNKAYA

    Doktora

    İngilizce

    İngilizce

    2011

    Endüstri ve Endüstri MühendisliğiOrta Doğu Teknik Üniversitesi

    Endüstri Mühendisliği Bölümü

    PROF. DR. NUR EVİN ÖZDEMİREL

    PROF. DR. SİNAN KAYALIGİL