Geri Dön

A genetic algorithm for constructing high accuracy decision trees

Başlık çevirisi mevcut değil.

  1. Tez No: 648544
  2. Yazar: ELİF ERSOY
  3. Danışmanlar: DR. ÖĞR. ÜYESİ ERİNÇ ALBEY, DR. ÖĞR. ÜYESİ ENİS KAYIŞ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Endüstri ve Endüstri Mühendisliği, Industrial and Industrial Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2020
  8. Dil: İngilizce
  9. Üniversite: Özyeğin Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Endüstri Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 72

Özet

Karar ağaçları, kolay uygulanması ve yorumlanabilir olması nedeniyle en çok tercih edilen sınıflandırma yöntemlerinden biridir. Geleneksel karar ağacı algoritmaları miyopik ve üstten aşağı doğru indüksiyon stratejisi kullanarak ağaçları inşa eder. CART (sınıflandırma ve regresyon ağacı), ID4, C4.5 bu algoritmalar arasındaki en iyi bilinen örneklerdendir. Ancak, bu yöntemlerin bazı dezavantajları vardır. En önemli dezavantajı, ağaçta sıradaki dallanma kararlaştırılırken gelecekteki kararlara etkileri göz önünde bulundurulmamasıdır. Diğer bir deyişle, bu algoritmaların miyopic doğası optimal çözümün bulunmasını engeller. Literatürde, optimal karar ağaçları oluşturmak için matematiksel modeller oluşturulmuştur (karma-tamsayılı matematiksel modeller). Oluşturulan modellerin optimal sonucu bulması garanti edilir, ancak yapısı gereğince NP-Zor bir problem olmasından dolayı orta büyüklükteki veri setlerinde makul bir sürede optimale ulaşmak zordur. Bu tez, geleneksel ağaçlardan, örneğin CART metodundan daha doğru bir ağaç bulmayı ve karma tamsayılı matematik modelinden daha kısa bir sürede optimale yakın sonucu bulmayı amaçlar. Bu amaçla, doğruluk derecesi yüksek karar ağaçları bulmak için kromozom yapıya sahip bir genetik algoritma öneriyoruz. Ayrıca, başlangıç popülasyonunda, rastgele oluşturulan ağaçların, daha az örnek ile oluşturulan CART algoritmalarının çözümlerinin ve matematiksel modelin çözümlerinin bir karışımına değineceğiz. önerilen genetik algoritmanın performansı, ortaya çıkan ağaçların derinliğinde çeşitli sınırlar ve belirtilen içeriklerde farklı popülasyon karışımları ile beş farklı veri seti kullanılarak test edildi. Sonuçlar, önerilen genetik algoritmanın performansının analizde kullanılan neredeyse tüm veri setlerinde CART'tan daha üstün olduğunu ortaya çıkarıyor.

Özet (Çeviri)

Decision trees are one of the most widely used classification methods because of their ease of implementation and explainable nature. Conventional decision tree algorithms construct trees by using myopic, greedy top-down induction strategies. CART (classification and regression tree), ID4, C4.5 are well-known examples of such algorithms. Yet, there are disadvantages of these greedy, myopic methods. One major disadvantage is that while determining next split, they do not consider the possible impact of this decision on future splits. In other words, their myopic nature impedes attaining global optimal solution. In the literature, mathematical programming (i.e., mixed integer programming (MIP) models) is also employed to find optimal trees. Solving constructed models using solvers that guarantee global optimal solution is possible yet remains intractable for even medium size instances due to NP-Hard nature of the problem. This study seeks to construct high accuracy trees than that of the conventional tree construction algorithms, such as CART; and to attain a near-optimal solutions in shorter time than MIP models. To achieve these, we propose a genetic algorithm with a genuine chromosome structure. We also address the selection of the initial population by considering a blend of randomly generated solutions, solutions from the CART, and solutions from the mathematical model, which are constructed for reduced problem instances. We test the performance of the proposed genetic algorithm using five different datasets, with varying bounds on the depth of the resulting trees and using different initial population blends within the mentioned varieties. Results reveal that the performance of the proposed genetic algorithm is superior to that of CART in almost all datasets used in the analysis.

Benzer Tezler

  1. Cam sektöründe talep tahmin yöntemlerinin uygulanması ve değerlendirilmesi

    Application and assessment of the demand forecasting methods in the glass sector

    NESLİHAN DEMİRCİ

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. MURAT BASKAK

  2. Using machine learning technigues for early cost prediction of structural systems of buildings

    Otomatik öğrenme teknikleriyle binaların strüktürel sisteminin erken maliyet tahmini

    SEVGİ ZEYNEP DOĞAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2005

    Mimarlıkİzmir Yüksek Teknoloji Enstitüsü

    Mimarlık Ana Bilim Dalı

    DOÇ. DR. MURAT GÜNAYDIN

    PROF. DR. GÖKMEN TAYFUR

  3. Dinamik ortamlar için istatiksel metotlar kullanan çoklu evrimsel algoritmalar

    Multiploid evolutionary algorithms with statistical methods for dynamic environments

    EMRULLAH GAZİOĞLU

    Doktora

    Türkçe

    Türkçe

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. AYŞE ŞİMA UYAR

  4. Androıd kötücül yazılımlarından koruma sistemlerinin değerlendirilmesi ve görüntü işleme algoritmalarını yapay zekâ teknikleri ile melezleştirerek yeni bir algılama yaklaşımının geliştirilmesi

    Evaluating the robustness of android anti-malware systems and developing a novel detection approach based on hybridizing image processing algorithms with artificial intelligence techniques

    HALİT BAKIR

    Doktora

    Türkçe

    Türkçe

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKırıkkale Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. HALİL MURAT ÜNVER

  5. Çok disiplinli yaklaşımla katı yakıtlı roket motoru yapısal dayanım ve iç balistik performans optimizasyonu

    A multidisciplinary approach in optimization of a solid rocket motor for structural strength and internal ballistic performance

    CEYHUN TOLA

    Doktora

    Türkçe

    Türkçe

    2017

    Uçak Mühendisliğiİstanbul Teknik Üniversitesi

    Uçak ve Uzay Mühendisliği Ana Bilim Dalı

    PROF. DR. MELİKE NİKBAY