Geri Dön

Ensemble pruning using optimization modeling

Optimizasyon modellemesi kullanarak topluluk budaması

  1. Tez No: 803043
  2. Yazar: PINAR KARADAYI ATAŞ
  3. Danışmanlar: DOÇ. DR. SÜREYYA AKYÜZ
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Matematik, Mühendislik Bilimleri, Computer Engineering and Computer Science and Control, Mathematics, Engineering Sciences
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2020
  8. Dil: İngilizce
  9. Üniversite: Bahçeşehir Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Mühendislik Bilimleri Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 67

Özet

Denetimsiz ögrenmede topluluk kümelenmesinin performans sorunu, veri madenciligi ve makine ögrenimi topluluklarında büyük bir endise kaynagıdır. En önemli endise, tahmini performansın sonucunu belirleyen çesitlilik ve dogruluktur. Bazı büyük fikirler performansı artırmak için bilesen sınıflandırıcılarının çesitliligini veya dogrulugunu artırırken, bazıları mükemmel topluluk sonuçları olusturmak için bu iki metrigi kullanmıs veya manipüle etmistir. Bu tez, literatürde belirtilen bazı topluluk kümelenme performans sınırlamalarının üstesinden gelebilecek yeni bir kümelenme toplulugu seçim modelini önermektedir, yani amacımız mevcut topluluk kümeleme modellerini önemli ölçüde artırmaktır. Daha spesifik olarak, yeni topluluk modelimizi çesitlilik ve dogruluk ödünlesmesini karsılamak için tasarladık ve karsılastırma için üç küme toplulugu yönteminin her biri için onbir veri seti kullandık. Ayrıca algoritmamızın veri alanına baglı olmamasını sagladık. Sadece çesitliligin veya dogrulugun tek basına performansı artıramayacagını degil, ayrıca topluluk alt kümelerinin kardinalitesinin iyi sonuçlar edinmek için önemli bir parametre oldugunu fark ettik. Tekniklerimizi kardinalite sayısı açısından son kümelenme teknikleriyle test ettikten ve karsılastırdıktan sonra, diger topluluk yöntemleriyle karsılastırıldıgında, önerilen topluluk seçme yöntemimizin daha iyi bir dogruluk saglama açısından performans artısı sagladıgını tespit ettik. Bunun yanında, önerilen metodoloji, veri ön islemedeki adımlardan olan özellik seçim problemi için uyarlanmıs, yeniden modellenmistir. Son yıllarda, çesitli özellik seçme yöntemlerinin birlestirildigi topluluk temelli özellik seçme yaklasımları önerilmistir. Önerilen algoritma birden fazla veri seti üzerinde test edilmistir ve ögrenme performansları çesitli özellik seçim algoritmaları ile karsılastırılmıstır. Ampirik sonuçlar, önerilen algoritmanın yüksek sınıflandırma dogrulugunda performans elde ettigini göstermektedir.

Özet (Çeviri)

The performance problem of ensemble clustering in unsupervised learning is a huge concern in data-mining and machine-learning communities. The most crucial concern is diversity and accuracy, both of which determine the outcome of predictive performance. While some great minds have increased the diversity or accuracy of component classifiers to boost performance, some have utilized or manipulated these two metrics to generate excellent ensemble results. This thesis suggests a new clustering ensemble selection model that can overcome some of the ensemble-clustering performance limitations noted in the literature, meaning our goal is to considerably enhance existing ensemble-clustering models. More specifically, we designed our new ensemble model to satisfy the diversity-andaccuracy trade-off and used eleven datasets for each of the three cluster-ensemble methods for comparison. We also ensured that our algorithm did not depend on the data domain. Not only did we realize that diversity or accuracy alone cannot enhance performance, but we also noticed that the cardinality of the ensemble subsets was an important parameter in obtaining better results. After testing and comparing our technique with recent clustering techniques in terms of the cardinalities, we found that compared to other ensemble methods, our proposed ensemble-selection method resulted in performance enhancement for providing a better accuracy to a particular problem. Besides that, the proposed methodology was adapted and re-modeled for feature selection problem, which is one of the steps in data pre-processing. In recent years, ensemble based feature selection approaches have been proposed in which, multiple diverse feature selection methods are combined. The proposed algorithm was tested on multiple data sets and learning performances are compared with various feature selection algorithms. The empirical results show that the proposed algorithm performs at higher classification accuracy.

Benzer Tezler

  1. Improved extreme learning machines and applications

    Geliştirilmiş aşırı öğrenme makineleri ve uygulamaları

    MOHANAD ABD SHEHAB AL KARAWI

    Doktora

    İngilizce

    İngilizce

    2018

    Elektrik ve Elektronik MühendisliğiYıldız Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ NİHAN KAHRAMAN

  2. Pruning the ensemble of deep neural networks with second-order cone programming

    İkinci dereceden konik programlama ile derin sinir ağları topluluğunun budanması

    BUSE ÇİSİL GÜLDOĞUŞ

    Doktora

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBahçeşehir Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    PROF. DR. SÜREYYA AKYÜZ

  3. Text categorization and ensemble pruning in turkish news portals

    Türkçe haber portallarında metin sınıflandırma ve topluluk budama

    ÇAĞRI TORAMAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2011

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. FAZLI CAN

  4. New cluster ensemble algorithm with automatic cluster number and new pruning technique for fast detection of neighbors on binary data

    Küme sayısını otomatik bulan bir kümelenme birleştirme algoritması ve ikili veride komşuların hızlı bulunması için yeni budama yöntemi

    MEHMET EMİN AKŞEHİRLİ

    Yüksek Lisans

    İngilizce

    İngilizce

    2011

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBahçeşehir Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. SELİM NECDET MİMAROĞLU

  5. Ensemble pruning in deep learning via semi-infinite optimization

    Yarı sonsuz optimizasyon ile derin öğrenmede topluluk budama

    MELİSA ÇALIŞKAN DEMİR

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Endüstri ve Endüstri MühendisliğiBahçeşehir Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    PROF. DR. SÜREYYA AKYÜZ