Geri Dön

Rolling look-ahead approaches for optimal classification trees

En iyi çözümlü karar ağaçları için kayarak ileriyi gören yaklaşımlar

  1. Tez No: 759436
  2. Yazar: ZEYNEL BATUHAN ORGAN
  3. Danışmanlar: DR. ÖĞR. ÜYESİ ENİS KAYIŞ, DR. ÖĞR. ÜYESİ TAGİ HANALİOĞLU
  4. Tez Türü: Yüksek Lisans
  5. Konular: Endüstri ve Endüstri Mühendisliği, Industrial and Industrial Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: İngilizce
  9. Üniversite: Özyeğin Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Endüstri Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Endüstri Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 66

Özet

Son zamanlardaki ikili sınıflandırma karar ağacı ̈oğrenim en iyileme formülasyonları, büyük derinliklerde veya büyük verisetlerinde ̈olçeklenebilirlikle ilgili sorunlar yaşamaktadır. Uzun saatler süren ̧calışma sürelerine rağmen, en iyi değeri kanıtlamakta sorun yaşamaktadırlar. Ayrıca, eğitim sürecinde amaç fonksiyonu olarak yanlış sınıflandırma metriği sonucu, test setinde yanlı bir sonuç ̧cıkabilmekte, iyi sınıflandırma yapmakta sorun yaşamaktadır. Bu ̧calışmada, ̈onceki ̧calışmaların veri boyutuna bağlı olan ve takip eden değişkenlerinden kurtulup, CART gibi algoritmalardan da esinlenerek, 2 derinlikli ağaçlar için yenilikçi bir formülasyon sunuyoruz. Algoritma açgözlü yaklaşımlar ve global optimizasyon yöntemleri arasında kalan spektrumdan faydalanıyor. Daha büyük derinlikli ağaçlar için ise, 2 seviye ileri görerek öğrenen hibrit bir algoritma geliştirdik. Bu algoritma, yaklaşık 50 bin satırlı, 135 ̈ozellikli bir veride 8 derinlikli bir ağacı 4 dakikadan daha kısa sürede çözebilir ve gelişime açıktır. Ayrıca, mevcutta bulunan en iyi global optimizasyon ve CART yaklaşımını skor sayısıyla geçebilirken, global optimizasyon modellerine göre test setinde %16.8'e kadar bir artış, CART'a göre ise %11.9'a kadar bir artış gözlemlenmiştir. Gözlemler 19 veri seti, 7 farklı derinlik ve 10 katlamalı veri grubunda test edilmiştir. v

Özet (Çeviri)

Classification trees have gained tremendous attention in machine learning applications due to their inherently interpretable nature. Current state-of-the-art formulations for learning optimal binary classification trees suffer from scalability for larger depths or larger instances. Moreover, they mostly fail to prove optimality after long run times and fit perfectly to the training data while minimizing misclassification error which is likely fail to generalize to the test data. We present a simple but powerful new formulation which we call rolling look-ahead learning approach. By dropping tractability variables which are dependent on instance size, we present a novel two-depth optimal binary classification tree formulation with the objective to minimize gini impurity or misclassification error. The approach can be thought of as a middle ground between myopic and global optimization methods. For larger depths, we developed a hybrid approach which learns by looking ahead 2-steps rolling horizon. It is much faster than the fastest known global optimization methods which can solve an instance with around 50K rows & 135 features in less than 4 minutes, for depth 8. Also, in majority of cases, the proposed approach outperforms global optimization methods & CART in terms of win count tested for 7 depths, 10 Fold and 19 benchmark datasets, and increase in out-of-sample accuracy up to 16.8% and 11.9% with respect to global optimization methods and CART, respectively.

Benzer Tezler

  1. Demiryollarında özelleştirme ve Türkiye açısından bir değerlendirme

    Privatization of railways and a discussion about Türkish national railways

    ŞAFAK HENGİRMEN

    Yüksek Lisans

    Türkçe

    Türkçe

    1995

    İnşaat Mühendisliğiİstanbul Teknik Üniversitesi

    PROF.DR. HALUK GERÇEK

  2. Spillovers between Turkish house pricing, stock exchanges, gold, CDS and exchange rate

    Türkiye konut fiyatları, hisse endeksleri, altın, CDS ve döviz kuru arasındaki yayılımlar

    ESER ŞENTÜRK

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Ekonometriİstanbul Teknik Üniversitesi

    Gayrimenkul Geliştirme Ana Bilim Dalı

    PROF. DR. BÜLENT GÜLOĞLU

  3. Rolling Stone dergisinde fotoğrafın kullanımı

    Using of photography in Rolling Stone magazine

    AYLİN ÜNAL

    Yüksek Lisans

    Türkçe

    Türkçe

    2010

    Gazetecilikİstanbul Üniversitesi

    Gazetecilik Ana Bilim Dalı

    DOÇ. DR. ASLI YAPAR GÖNENÇ

  4. Rolling the ball back: Topic maintenance in computer mediated English as a lingua franca interactions

    Topu geri atma: Bilgisayar aracılı ortak dil olarak İngilizce kullanılan etkileşimlerde konu devamlılığı

    BETÜL ÇİMENLİ

    Yüksek Lisans

    İngilizce

    İngilizce

    2017

    Eğitim ve ÖğretimHacettepe Üniversitesi

    Yabancı Dil Olarak İngilizce Öğretimi Ana Bilim Dalı

    YRD. DOÇ. DR. OLCAY SERT

  5. Yassı çelik haddelemede kullanılan sıcak şerit haddehane hadde merdanelerinin aşınma parametrelerinin optimizasyonu ile servis ömürlerinin uzatılması

    Optimizing the parameters of wearing of hot strip mill work rolls and increasing roll service life that used in the flat steel manufacturing

    CANER TOPTAŞ

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    Makine Mühendisliğiİstanbul Teknik Üniversitesi

    Makine Mühendisliği Ana Bilim Dalı

    PROF. DR. CEVAT ERDEM İMRAK