Geri Dön

Cluster ensemble selection by optimization of accuracy-diversity trade-off

Doğruluk ve çeşitlilik ödünleşimlerinin eniyilemesi ile kümeleme topluluklarının seçilmesi

  1. Tez No: 510097
  2. Yazar: BUSE ÇİSİL OTAR
  3. Danışmanlar: DOÇ. DR. SÜREYYA AKYÜZ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Endüstri ve Endüstri Mühendisliği, Computer Engineering and Computer Science and Control, Industrial and Industrial Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2018
  8. Dil: İngilizce
  9. Üniversite: Bahçeşehir Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Endüstri Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 56

Özet

Makine Öğrenmesi yöntemlerinden birisi olan Eğiticisiz Öürenme algoritmalarından kümeleme, etiketsiz biçimde benzer nesneleri aynı küme içinde toplamaya olanak sağlar. Araştırmalar kümeleme topluluklarının farklı kümeleme çözümlerinin tek bir kümeleme algoritmasından daha iyi sonuçlar verdiğini göstermektedir. Doğruluk ve çeşitlilik algoritmanın başarısını etkileyen önemli faktörlerdendir ve aralarında bir ödünleşim bulunmaktadır. Doğruluk arttırılırken çeşitlilikten ya da çeşitlilik arttırılırken doğruluktan ödün verilmektedir. Gereksiz kümeleyicilerin topluluktan çıkartılarak ideal sayıda kümeleme çözümlerinin bulunması literatürdeki problemlerden birisidir. Bu tezin amacı, kümeleme topluluklarından en yararlı şekilde doğruluk ve çeşitlilik kriterlerini sağlayacak belirli miktarda kümeleyicilerin eniyilemesi ile biçimlendirilerek seçilmesidir. Diğer bir deyişle, eniyileme modeli geliştirilerek, uygun şartları sağlayan topluluk içindeki tek bir kümeleme çözümü bulunmuştur. Literatürde bölümleme algoritmalarından en çok tercih edilen K-Ortalama algoritması temel kümeleme yöntemi olarak kullanılmıştır. Elde edilen kümeleme topluluğu algoritması, farklı alanlardan veri setlerine uygulanıp verilerden bağımsız olarak çözülmüş ve başarı oranları diğer kümeleme algoritmalarıyla karşılaştırılmıştır. Sonuç olarak geliştirilmiş kümeleme topluluğu seçimi çoğunlukla diğer kümeleme algoritmalarından daha iyi normalize edilmiş karşılıklı bilgileşim değerleri vermiştir.

Özet (Çeviri)

Clustering is one of the unsupervised learning methods in machine learning which deals with grouping objects that are similar among each other and dissimilar among groups. Researches show that decision of an ensemble of clusters gives better results than a single clustering solution. The accuracy and the diversity of the ensemble are considered as crucial factors influencing on the success of ensemble learning. The importance of these factors stems from the fact that there is a trade-off between the accuracy and the diversity features of different clustering solutions in which the improvement in one of these features induces the deterioration of the other one. Discovering the best subset of the ensemble is one of the challenging problems in the literature. This thesis focuses on selecting the best clustering solutions from an ensemble that optimizes the accuracy and the diversity simultaneously. In other words, a common decision by an aggregated clustering solution which provides the optimum accuracy and diversity in the ensemble is determined by an optimization model. K-means algorithm is used as a base clustering method due to its preference in the literature for clustering. A novel ensemble cluster selection developed in this thesis is independent from the data and the performance of the proposed algorithm is compared with different clustering algorithms on data sets from different domains. It is shown that the improved ensemble selection frequently gives better performance than existing ensemble selection algorithms in the literature.

Benzer Tezler

  1. Makine öğrenme problemlerinde konveks olmayan optimizasyon modellerinin iki konveks fonksiyonunun farkı ve ikinci derece konik progromlama ile modellenmesi

    Difference of convex functions programming and second-order conic programming modelling of non-convex optimization problems in machine learning

    DUYGU ÜÇÜNCÜ

    Doktora

    Türkçe

    Türkçe

    2024

    MatematikYıldız Teknik Üniversitesi

    Matematik Ana Bilim Dalı

    PROF. DR. ERDAL GÜL

    PROF. DR. SÜREYYA AKYÜZ

  2. Teknoloji fırsat keşfi için veri odaklı çözüm yaklaşımlarının geliştirilmesi

    Development of data-driven solution approaches for technology opportunity discovery

    ZÜLFİYE ERDOĞAN

    Doktora

    Türkçe

    Türkçe

    2024

    Endüstri ve Endüstri MühendisliğiYıldız Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    PROF. DR. SERKAN ALTUNTAŞ

    PROF. DR. TÜRKAY DERELİ

  3. A multi-objective approach to cluster ensemble selection problem

    Kümeleme topluluğu seçimi problemine çok amaçlı yaklaşım

    DİLAY AKTAŞ

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Endüstri ve Endüstri MühendisliğiOrta Doğu Teknik Üniversitesi

    Yöneylem Araştırması Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ BANU LOKMAN

    DOÇ. DR. TÜLİN İNKAYA

  4. New cluster ensemble algorithm with automatic cluster number and new pruning technique for fast detection of neighbors on binary data

    Küme sayısını otomatik bulan bir kümelenme birleştirme algoritması ve ikili veride komşuların hızlı bulunması için yeni budama yöntemi

    MEHMET EMİN AKŞEHİRLİ

    Yüksek Lisans

    İngilizce

    İngilizce

    2011

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBahçeşehir Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. SELİM NECDET MİMAROĞLU

  5. Lisans yerleştirme sınavında yerleşme başarısının karar ağaçlarına göre bagging ve boosting yöntemleriyle sınıflandırılması

    Classification of replacement success according to decision trees by using bagging and boosting methods

    TUĞBA TUĞ KAROĞLU

    Doktora

    Türkçe

    Türkçe

    2018

    İstatistikVan Yüzüncü Yıl Üniversitesi

    Zootekni Ana Bilim Dalı

    PROF. DR. HAYRETTİN OKUT