Geri Dön

A multi-objective approach to cluster ensemble selection problem

Kümeleme topluluğu seçimi problemine çok amaçlı yaklaşım

  1. Tez No: 571118
  2. Yazar: DİLAY AKTAŞ
  3. Danışmanlar: DR. ÖĞR. ÜYESİ BANU LOKMAN, DOÇ. DR. TÜLİN İNKAYA
  4. Tez Türü: Yüksek Lisans
  5. Konular: Endüstri ve Endüstri Mühendisliği, Industrial and Industrial Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2019
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Yöneylem Araştırması Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 89

Özet

Kümeleme, verideki gizli örüntüleri ön bilgi olmadan ortaya çıkarmayı hedefleyen gözetimsiz bir öğrenme biçimidir. Kümelemede benzer olan nesneler aynı kümede, benzer olmayan nesneler farklı kümelerde olacak şekilde verinin gruplandırılması amaçlanmaktadır. Öneri sistemleri, dolandırıcılık tespiti, pazar araştırması gibi çeşitli alanlarda kullanılmaktadır. Teknolojideki gelişmelerle birlikte, bir veri setinden farklı kümeleme algoritmaları, farklı parametreler ve farklı öznitelikler kullanılarak çeşitli kümeleme çözümleri elde edilebilmektedir. Kümeleme topluluğu (clustering ensemble), bir veri setinden farklı kümeleme yöntemleri ile elde edilen çözümlerin birleştirilerek fikir birliğine varılan ortak bir çözüm (consensus clustering) oluşturulması için ortaya çıkan güçlü bir araçtır. Böylece, gürbüz (robust) ve doğru (accurate) kümeleme sonuçları elde edilmektedir. Bu çalışmada, kümeleme topluluğu seçimi problemi için çok amaçlı bir yaklaşım önerilerek ortak çözümler üretilmiştir. Önerdiğimiz yaklaşım mevcut kümeleme çözümlerinden temsilciler seçip bu temsilcilerin birleştirilmesiyle bir ortak çözüm üretmektedir. Mevcut çalışmalardan farklı olarak bu çalışmada, bir kümeleme topluluğundan kalite, çeşitlilik ve temsilci sayısına göre baskın temsilci alt kümeleri seçilmesi amaçlanmaktadır. Alt küme seçim aşamasından önce başlangıç kütüphanesinin özelliklerini incelemek ve ortak çözümü yanıltabilecek ayrık çözümlerin elenmesi hedeflenerek bir ön eleme yöntemi geliştirilmiştir. Önerilen yaklaşımın performansı gerçek sınıf etiketleri bilinen veri setleri üzerinde test edilmiştir. Sonuçlar yaklaşımımızın iyi çalıştığı ve elde edilen ortak çözüm sonuçlarının mevcut çözümler ile kıyaslandığında daha iyi olduğunu göstermektedir.

Özet (Çeviri)

Clustering is an unsupervised learning method that partitions a data set into groups. The aim is to assign similar points to the same cluster and dissimilar points to different clusters with respect to some notion of similarity. It is applicable to a wide range of areas such as recommender systems, anomaly detection, market research, and customer segmentation. With the advances in the computational power, a diverse set of clustering solutions can be obtained from a dataset using different clustering algorithms, different parameter settings and different features. Clustering ensemble has emerged as a powerful tool for combining the strengths of these multiple clustering solutions and generating a consensus solution. It improves the quality of clustering in terms of accuracy and robustness. In this study, we address the cluster ensemble selection problem, and propose a multi-objective approach to generate a consensus clustering solution. Our proposed algorithm selects a representative subset of clustering solutions, and produces a consensus clustering solution by combining these representatives. Different from the existing approaches, we design the representative selection approach based on three criteria: quality, diversity, and size of the representative set. Before the representative selection, we apply a preprocessing procedure to analyze the characteristics of the clustering solutions in the library and eliminate the ones that may mislead the consensus function. We test the performance of the proposed approach on the benchmark datasets. The results show that the proposed approach works well, and the resulting consensus solution is better than the clustering solutions in the library.

Benzer Tezler

  1. Mevcut atölye tipi üretim sisteminin tasarlanacak bir hücresel imalat sistemi ile karşılaştırılması ve çok amaçlı bir model

    A comparison of a current job-shop production system with a cellular manufacturing system and a multi-objective model

    İHSAN EROZAN

    Doktora

    Türkçe

    Türkçe

    2014

    Endüstri ve Endüstri MühendisliğiSakarya Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    PROF. DR. ORHAN TORKUL

  2. Optimal energy efficient sensor network design

    Algılayıcı ağ tasarımı

    RAED S.M. DARAGHMA

    Doktora

    İngilizce

    İngilizce

    2016

    Elektrik ve Elektronik MühendisliğiAnadolu Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. NURAY AT

  3. Some optimal control problems in electric vehicles

    Elektrikli araçlarda bazı optimal kontrol problemleri

    KENAN AHISKA

    Doktora

    İngilizce

    İngilizce

    2016

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. MEHMET KEMAL LEBLEBİCİOĞLU

    PROF. DR. MUSTAFA KEMAL ÖZGÖREN

  4. Çok amaçlı genetik algoritma kullanarak DNA mikrodizi verilerinin kümelenmesi

    Clustering DNA microarray data via multi-objective genetic algorithm

    MUSTAFA KAHRAMAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2010

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat Üniversitesi

    Biyomühendislik Ana Bilim Dalı

    DOÇ. DR. MEHMET KAYA

  5. Performans tabanlı tasarıma bütünleşik yaklaşım

    Integrated design approach to performance based design

    BENAN ŞAHİN KARAGÖZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    Mimarlıkİstanbul Teknik Üniversitesi

    Bilişim Ana Bilim Dalı

    DOÇ. DR. YÜKSEL DEMİR