A genetic algorithm for constructing high accuracy decision trees
Başlık çevirisi mevcut değil.
- Tez No: 648544
- Danışmanlar: DR. ÖĞR. ÜYESİ ERİNÇ ALBEY, DR. ÖĞR. ÜYESİ ENİS KAYIŞ
- Tez Türü: Yüksek Lisans
- Konular: Endüstri ve Endüstri Mühendisliği, Industrial and Industrial Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2020
- Dil: İngilizce
- Üniversite: Özyeğin Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Endüstri Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 72
Özet
Karar ağaçları, kolay uygulanması ve yorumlanabilir olması nedeniyle en çok tercih edilen sınıflandırma yöntemlerinden biridir. Geleneksel karar ağacı algoritmaları miyopik ve üstten aşağı doğru indüksiyon stratejisi kullanarak ağaçları inşa eder. CART (sınıflandırma ve regresyon ağacı), ID4, C4.5 bu algoritmalar arasındaki en iyi bilinen örneklerdendir. Ancak, bu yöntemlerin bazı dezavantajları vardır. En önemli dezavantajı, ağaçta sıradaki dallanma kararlaştırılırken gelecekteki kararlara etkileri göz önünde bulundurulmamasıdır. Diğer bir deyişle, bu algoritmaların miyopic doğası optimal çözümün bulunmasını engeller. Literatürde, optimal karar ağaçları oluşturmak için matematiksel modeller oluşturulmuştur (karma-tamsayılı matematiksel modeller). Oluşturulan modellerin optimal sonucu bulması garanti edilir, ancak yapısı gereğince NP-Zor bir problem olmasından dolayı orta büyüklükteki veri setlerinde makul bir sürede optimale ulaşmak zordur. Bu tez, geleneksel ağaçlardan, örneğin CART metodundan daha doğru bir ağaç bulmayı ve karma tamsayılı matematik modelinden daha kısa bir sürede optimale yakın sonucu bulmayı amaçlar. Bu amaçla, doğruluk derecesi yüksek karar ağaçları bulmak için kromozom yapıya sahip bir genetik algoritma öneriyoruz. Ayrıca, başlangıç popülasyonunda, rastgele oluşturulan ağaçların, daha az örnek ile oluşturulan CART algoritmalarının çözümlerinin ve matematiksel modelin çözümlerinin bir karışımına değineceğiz. önerilen genetik algoritmanın performansı, ortaya çıkan ağaçların derinliğinde çeşitli sınırlar ve belirtilen içeriklerde farklı popülasyon karışımları ile beş farklı veri seti kullanılarak test edildi. Sonuçlar, önerilen genetik algoritmanın performansının analizde kullanılan neredeyse tüm veri setlerinde CART'tan daha üstün olduğunu ortaya çıkarıyor.
Özet (Çeviri)
Decision trees are one of the most widely used classification methods because of their ease of implementation and explainable nature. Conventional decision tree algorithms construct trees by using myopic, greedy top-down induction strategies. CART (classification and regression tree), ID4, C4.5 are well-known examples of such algorithms. Yet, there are disadvantages of these greedy, myopic methods. One major disadvantage is that while determining next split, they do not consider the possible impact of this decision on future splits. In other words, their myopic nature impedes attaining global optimal solution. In the literature, mathematical programming (i.e., mixed integer programming (MIP) models) is also employed to find optimal trees. Solving constructed models using solvers that guarantee global optimal solution is possible yet remains intractable for even medium size instances due to NP-Hard nature of the problem. This study seeks to construct high accuracy trees than that of the conventional tree construction algorithms, such as CART; and to attain a near-optimal solutions in shorter time than MIP models. To achieve these, we propose a genetic algorithm with a genuine chromosome structure. We also address the selection of the initial population by considering a blend of randomly generated solutions, solutions from the CART, and solutions from the mathematical model, which are constructed for reduced problem instances. We test the performance of the proposed genetic algorithm using five different datasets, with varying bounds on the depth of the resulting trees and using different initial population blends within the mentioned varieties. Results reveal that the performance of the proposed genetic algorithm is superior to that of CART in almost all datasets used in the analysis.
Benzer Tezler
- Cam sektöründe talep tahmin yöntemlerinin uygulanması ve değerlendirilmesi
Application and assessment of the demand forecasting methods in the glass sector
NESLİHAN DEMİRCİ
Yüksek Lisans
Türkçe
2015
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. MURAT BASKAK
- Using machine learning technigues for early cost prediction of structural systems of buildings
Otomatik öğrenme teknikleriyle binaların strüktürel sisteminin erken maliyet tahmini
SEVGİ ZEYNEP DOĞAN
Yüksek Lisans
İngilizce
2005
Mimarlıkİzmir Yüksek Teknoloji EnstitüsüMimarlık Ana Bilim Dalı
DOÇ. DR. MURAT GÜNAYDIN
PROF. DR. GÖKMEN TAYFUR
- Dinamik ortamlar için istatiksel metotlar kullanan çoklu evrimsel algoritmalar
Multiploid evolutionary algorithms with statistical methods for dynamic environments
EMRULLAH GAZİOĞLU
Doktora
Türkçe
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. AYŞE ŞİMA UYAR
- Androıd kötücül yazılımlarından koruma sistemlerinin değerlendirilmesi ve görüntü işleme algoritmalarını yapay zekâ teknikleri ile melezleştirerek yeni bir algılama yaklaşımının geliştirilmesi
Evaluating the robustness of android anti-malware systems and developing a novel detection approach based on hybridizing image processing algorithms with artificial intelligence techniques
HALİT BAKIR
Doktora
Türkçe
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKırıkkale ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. HALİL MURAT ÜNVER
- Çok disiplinli yaklaşımla katı yakıtlı roket motoru yapısal dayanım ve iç balistik performans optimizasyonu
A multidisciplinary approach in optimization of a solid rocket motor for structural strength and internal ballistic performance
CEYHUN TOLA
Doktora
Türkçe
2017
Uçak Mühendisliğiİstanbul Teknik ÜniversitesiUçak ve Uzay Mühendisliği Ana Bilim Dalı
PROF. DR. MELİKE NİKBAY