A memetic algorithm for clustering with cluster based feature selection
Küme özgü öznitelik seçimi ile kümeleme problemine memetik algoritma yaklaşımı
- Tez No: 756035
- Danışmanlar: PROF. DR. CEM İYİGÜN
- Tez Türü: Yüksek Lisans
- Konular: Endüstri ve Endüstri Mühendisliği, Industrial and Industrial Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Yöneylem Araştırması Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 131
Özet
Kümeleme metodu benzer veri noktalarını aynı gruba, birbirine benzemeyen veri noktalarını ise ayrı gruplara yerleştirmeyi hedefleyen yaygın kullanılan bir güdümsüz öğrenme metodudur. Kümeleme metoduna bağlı olan veri noktaları çoğunlukla yüksek boyutlu verilerden oluşmaktadır ve bu veriler ayırt edici ve alakasız öznitelikler içermektedir. Bu nedenle, başarılı bir kümeleme yapabilmek adına ayırt edici özniteliklerin seçilmesi de önemli bir problem arz etmektedir. Bu çalışmada ayırt edici özelliklerin her bir küme için değişken olabileceği ve her bir küme gruplara ayrılırken farklı öznitelikleri kullanacağı öngörülmüştür. Dolayısıyla odaklamılan problem küme özgü öznitelik seçimi ile kümeleme problemi olarak adlandırılmıştır. Problemde kümelemerin bir merkez etrafında oluştuğu yaklaşımıyla, ayırt edici özniteliklerin seçilmesi, küme merkezlerinin belilenmesi ve veri noktalarının kümelere atanması görevleri bir arada değerlendirilmektedir. Bu problem kombinatoryal NP-hard bir problemdir ve matematiksel modeller büyük ölçekli problemleri çözmekte yetersiz kalmaktadır. Ayrıca, literatürde geliştirilmiş olan sezgisel metodlar yüksek değişkenliğe sahip sonuçlar elde etmektedir. Bu nedenle, problemin çözülmesi adına probleme odaklı geliştirilen bir metasezgisel yöntem izlenmiştir. Yüksek sayıda veri noktasına sahip veri setlerini kümelemek adına genetik algoritma ve komşuluk arama metodlarını içeren bir memetik algoritma önerilmiştir. Ayrıca, yüksek boyutlu veri setleri üzerinde başarılı sonuçlar elde etmek adına güncellenmiş bir memetik algoritma yaklaşımı geliştirilmiştir. Önerilen algoritmalar farklı problem büyüklüklerine ve boyutlarına sahip olan farklı veri örnekleri üzerinde test edilmiştir. Bu testler hem gerçek hem de yapay olarak oluşturulmuş veri setleri üzerinde uygulanmıştır. Yapılan testler sonucunda geliştirilen algoritmaların mevcut çalışmalardan üstün performans gösterdiği, ayrıca yüksek başarı ve düşük verimliliğe sahip sonuçlara ulaştığı gözlenmiştir.
Özet (Çeviri)
Clustering is a well known unsupervised learning method which aims to group the similar data points and separate the dissimilar ones. Data sets that are subject to clustering are mostly high dimensional and these dimensions include relevant and redundant features. Therefore, selection of related features is a significant problem to obtain successful clusters. In this study, it is considered that relevant features for each cluster can be varied as each cluster in a data set is grouped by different set of features, so the problem is named as clustering with cluster based feature selection problem. We approach the problem as a center based clustering and three tasks which are selection of relevant features, decision of cluster centroid locations, and assignment of data points to the clusters are considered. The problem is combinatorially NP-Hard and mathematical models are not capable to solve large-size problems. Moreover, developed heuristics in the literature obtain results with high variance. Therefore, a metaheuristic framework which follows the problem characteristics is proposed. A memetic algorithm that integrates a genetic approach and neighborhood search is proposed to solve data sets with high number of data points. A modified version of this algorithm is also developed for high dimensional data sets. Proposed algorithms have been tested on different problem instances with different size and dimensions. Both simulated and real data sets are utilized for the tests. Experimental results have shown that the proposed approach obtains stable results with high accuracy and outperforms the state of the art.
Benzer Tezler
- Kablosuz sensör ağlarında enerji tüketimi optimizasyon algoritması
Optimization algorithms for energy consumption in wireless sensor networks
BASMA SALEH LARBAH
Doktora
Türkçe
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKastamonu ÜniversitesiMalzeme Bilimi ve Mühendisliği Ana Bilim Dalı
DOÇ. DR. CAN DOĞAN VURDU
- Yapay bağışıklık algoritmaları kullanılarak bulanık sistem tasarımı
The fuzzy system designing using artificial immune system algorithms
AYŞE MERVE ACILAR
Doktora
Türkçe
2013
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSelçuk ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. AHMET ARSLAN
- Memetic optimization algorithms applied to solves clustering problems
Başlık çevirisi yok
HALAH ZAHER FLAYYIH ALZUBAIDI
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBahçeşehir ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. ŞEREF KALEM
- A memetic algorithm for hybrid flow-shop scheduling with multiprocessor tasks and due windows
Zaman pencereli çok işlemcili hibrit akış tipi çizelgeleme probleminin memetik algoritma ile çözümü
BATUHAN EREN ENGİN
Yüksek Lisans
İngilizce
2016
Endüstri ve Endüstri MühendisliğiSelçuk ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
PROF. DR. ORHAN ENGİN
- A multi-objective memetic algorithm for mixed-model two-sided disassembly line balancing problem
Karma modelli çift taraflı demontaj hattı dengeleme problemi için bir çok amaçlı memetik algoritma
SERKAN MUTLU
Yüksek Lisans
İngilizce
2021
Endüstri ve Endüstri MühendisliğiEskişehir Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ BANU GÜNER