Cluster ensemble selection by optimization of accuracy-diversity trade-off
Doğruluk ve çeşitlilik ödünleşimlerinin eniyilemesi ile kümeleme topluluklarının seçilmesi
- Tez No: 510097
- Danışmanlar: DOÇ. DR. SÜREYYA AKYÜZ
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Endüstri ve Endüstri Mühendisliği, Computer Engineering and Computer Science and Control, Industrial and Industrial Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2018
- Dil: İngilizce
- Üniversite: Bahçeşehir Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Endüstri Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 56
Özet
Makine Öğrenmesi yöntemlerinden birisi olan Eğiticisiz Öürenme algoritmalarından kümeleme, etiketsiz biçimde benzer nesneleri aynı küme içinde toplamaya olanak sağlar. Araştırmalar kümeleme topluluklarının farklı kümeleme çözümlerinin tek bir kümeleme algoritmasından daha iyi sonuçlar verdiğini göstermektedir. Doğruluk ve çeşitlilik algoritmanın başarısını etkileyen önemli faktörlerdendir ve aralarında bir ödünleşim bulunmaktadır. Doğruluk arttırılırken çeşitlilikten ya da çeşitlilik arttırılırken doğruluktan ödün verilmektedir. Gereksiz kümeleyicilerin topluluktan çıkartılarak ideal sayıda kümeleme çözümlerinin bulunması literatürdeki problemlerden birisidir. Bu tezin amacı, kümeleme topluluklarından en yararlı şekilde doğruluk ve çeşitlilik kriterlerini sağlayacak belirli miktarda kümeleyicilerin eniyilemesi ile biçimlendirilerek seçilmesidir. Diğer bir deyişle, eniyileme modeli geliştirilerek, uygun şartları sağlayan topluluk içindeki tek bir kümeleme çözümü bulunmuştur. Literatürde bölümleme algoritmalarından en çok tercih edilen K-Ortalama algoritması temel kümeleme yöntemi olarak kullanılmıştır. Elde edilen kümeleme topluluğu algoritması, farklı alanlardan veri setlerine uygulanıp verilerden bağımsız olarak çözülmüş ve başarı oranları diğer kümeleme algoritmalarıyla karşılaştırılmıştır. Sonuç olarak geliştirilmiş kümeleme topluluğu seçimi çoğunlukla diğer kümeleme algoritmalarından daha iyi normalize edilmiş karşılıklı bilgileşim değerleri vermiştir.
Özet (Çeviri)
Clustering is one of the unsupervised learning methods in machine learning which deals with grouping objects that are similar among each other and dissimilar among groups. Researches show that decision of an ensemble of clusters gives better results than a single clustering solution. The accuracy and the diversity of the ensemble are considered as crucial factors influencing on the success of ensemble learning. The importance of these factors stems from the fact that there is a trade-off between the accuracy and the diversity features of different clustering solutions in which the improvement in one of these features induces the deterioration of the other one. Discovering the best subset of the ensemble is one of the challenging problems in the literature. This thesis focuses on selecting the best clustering solutions from an ensemble that optimizes the accuracy and the diversity simultaneously. In other words, a common decision by an aggregated clustering solution which provides the optimum accuracy and diversity in the ensemble is determined by an optimization model. K-means algorithm is used as a base clustering method due to its preference in the literature for clustering. A novel ensemble cluster selection developed in this thesis is independent from the data and the performance of the proposed algorithm is compared with different clustering algorithms on data sets from different domains. It is shown that the improved ensemble selection frequently gives better performance than existing ensemble selection algorithms in the literature.
Benzer Tezler
- Makine öğrenme problemlerinde konveks olmayan optimizasyon modellerinin iki konveks fonksiyonunun farkı ve ikinci derece konik progromlama ile modellenmesi
Difference of convex functions programming and second-order conic programming modelling of non-convex optimization problems in machine learning
DUYGU ÜÇÜNCÜ
Doktora
Türkçe
2024
MatematikYıldız Teknik ÜniversitesiMatematik Ana Bilim Dalı
PROF. DR. ERDAL GÜL
PROF. DR. SÜREYYA AKYÜZ
- Teknoloji fırsat keşfi için veri odaklı çözüm yaklaşımlarının geliştirilmesi
Development of data-driven solution approaches for technology opportunity discovery
ZÜLFİYE ERDOĞAN
Doktora
Türkçe
2024
Endüstri ve Endüstri MühendisliğiYıldız Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
PROF. DR. SERKAN ALTUNTAŞ
PROF. DR. TÜRKAY DERELİ
- A multi-objective approach to cluster ensemble selection problem
Kümeleme topluluğu seçimi problemine çok amaçlı yaklaşım
DİLAY AKTAŞ
Yüksek Lisans
İngilizce
2019
Endüstri ve Endüstri MühendisliğiOrta Doğu Teknik ÜniversitesiYöneylem Araştırması Ana Bilim Dalı
DR. ÖĞR. ÜYESİ BANU LOKMAN
DOÇ. DR. TÜLİN İNKAYA
- New cluster ensemble algorithm with automatic cluster number and new pruning technique for fast detection of neighbors on binary data
Küme sayısını otomatik bulan bir kümelenme birleştirme algoritması ve ikili veride komşuların hızlı bulunması için yeni budama yöntemi
MEHMET EMİN AKŞEHİRLİ
Yüksek Lisans
İngilizce
2011
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBahçeşehir ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. SELİM NECDET MİMAROĞLU
- Lisans yerleştirme sınavında yerleşme başarısının karar ağaçlarına göre bagging ve boosting yöntemleriyle sınıflandırılması
Classification of replacement success according to decision trees by using bagging and boosting methods
TUĞBA TUĞ KAROĞLU
Doktora
Türkçe
2018
İstatistikVan Yüzüncü Yıl ÜniversitesiZootekni Ana Bilim Dalı
PROF. DR. HAYRETTİN OKUT