Tuning model complexity using cross-validation for supervised learning

Gözetimli öğrenmede çapraz geçerleme ile model karmaşıklığının ayarlanması

PDF İndir

Tez No: 170851
Yazar: OLCAY TANER YILDIZ
Danışmanlar: PROF.DR. ETHEM ALPAYDIN
Tez Türü: Doktora
Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
Anahtar Kelimeler: Belirtilmemiş.
Yıl: 2005
Dil: İngilizce
Üniversite: Boğaziçi Üniversitesi
Enstitü: Fen Bilimleri Enstitüsü
Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
Bilim Dalı: Belirtilmemiş.
Sayfa Sayısı: 209

Özet

ÖZET gözetimli öğrenmede çapraz geçerleme ile model karmaşıklığının ayarlanması Bu tezde, model seçiminde çapraz geçerleme kullanımını gözden geçirerek gözetimli modellerden en iyisini bulan MultiTest metodunu önerdik. MultiTest algoritması, gözetimli öğrenme algoritmalarını beklenen hata üzerindeki ikili istatistiksel testlerin sonuçlarına ve algoritmanın karmaşıklığı gibi önceliklere göre sıralar. MultiTest meto dunu geçerlemek için ANOVA ve Newman-Keuls algoritmalarıyla karşılaştırdık. Bu algoritmalar metodların hata oranlarının aynı olup olmadığını kontrol eder. En iyi al goritmayı bulmak için kullanılabilseler bile, bu her zaman çalışmayabilir. Oysa, bizim önerdiğimiz metod her zaman en iyiyi bulabilir. MultiTest metodunu model karmaşıklığını eniyilemede kullanmaya çalıştık. Bunun için ya tüm olası modelleri MultiTest'le karşılaştırdık ve en iyi modeli seçtik ya da (model uzayı genişse) MultiTest'i kullanarak model uzayında etkili bir arama yaptık. Tüm modeller aranabildiğinde, MultiTest diğerlerinden anlamlı bir şekilde kötü ol mayan en basit modeli seçer. Tezde, ayrıca karar ağacı ve kural çıkarımı için karma, tüm değişkenli bir yapı önerdik. Bu yapı, modelin karmaşıklığını oraya ulaşan verinin karmaşıklığına uyduran, farklı yerlerde farklı modellerin olabildiği karma bir yapıdır. Önerdiğimiz Multi- Test'e dayalı, çok değişkenli yapıyı çok bilinen model seçme teknikleriyle standart veri kümeleri üzerinde karşılaştırdık.

Özet (Çeviri)

IV ABSTRACT TUNING MODEL COMPLEXITY USING CROSS-VALIDATION FOR SUPERVISED LEARNING In this thesis, we review the use of cross-validation for model selection and pro pose the MultiTest method which solves the problem of choosing the best of multiple candidate supervised models. The MultiTest algorithm orders supervised learning algo rithms (for classification and regression) taking into account both the result of pairwise statistical tests on expected error, and our prior preferences such as complexity of the algorithm. In order to validate the MultiTest method, we compared it with Anova, Newman-Keuls algorithms which check whether multiple methods have the same ex pected error. Though Anova and Newman-Keuls results can be extended to find a“best”algorithm, this does not always work. On the other hand, our proposed method is always able to find an algorithm as the“best”one. By using MultiTest method, we try to solve the problem of optimizing model complexity. For doing this, either we compare all possible models using MultiTest and select the best model or if the model space is very large, we make an effective search on the model space via MultiTest. If all possible models can be searched, MultiTest-based model selection always selects the simplest model with expected error not significantly worse than any other model. We also propose a hybrid, omnivariate architecture, for decision tree induction and rule induction. This is a hybrid architecture that contains different models at different places matching the complexity of the model to the complexity of the data reaching that model. We compare our proposed MultiTest-based omnivariate architec ture with the well-known techniques for model selection on standard datasets.

Benzer Tezler

Tez No
959203
Makine öğrenmesi kullanarak Türkiye'de elektrikli araç şarj istasyonlarının potansiyel kullanım performansının mekânsal tahmini
Spatial estimation of potential utilization performance of electric vehicle charging stations in Türkiye using machine learning methods
SERKAN TANRIVERDİ
Yüksek Lisans
Türkçe
2025
Jeodezi ve Fotogrametri İstanbul Teknik Üniversitesi
Geomatik Mühendisliği Ana Bilim Dalı
DOÇ. DR. ADALET DERVİŞOĞLU
Tez No
823792
A machine learning model to guide the synthesis of supported palladium catalysts
Başlık çevirisi yok
KÜBRA TIRAŞ
Yüksek Lisans
İngilizce
2023
Kimya Mühendisliği Koç Üniversitesi
Kimya ve Biyoloji Mühendisliği Ana Bilim Dalı
PROF. DR. ALPER UZUN
Tez No
954353
Homojen olmayan bir yüzey altında gömülü nesneler için evrişimsel sinir ağı tabanlı hedef tespiti
Convolutional neural network based target detection for objects buried under a non-homogeneous surface
ALİ BATUHAN BAĞCACIER
Yüksek Lisans
Türkçe
2025
Elektrik ve Elektronik Mühendisliği İstanbul Teknik Üniversitesi
Savunma Teknolojileri Ana Bilim Dalı
PROF. DR. ALİ YAPAR
Tez No
955405
XAU/USD prıce predıctıon usıng deep learnıng: hyperparameter optımızatıon wıth bayesıan, grey-wolf and genetıc algorıthms
Derin öğrenme kullanarak XAU/USD fiyat tahmini: bayes, gri kurt ve genetik algoritmalarla hiperparametre optimizasyonu
MELİS KÜÇÜK
Yüksek Lisans
İngilizce
2025
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol İstanbul Teknik Üniversitesi
İşletme Mühendisliği Ana Bilim Dalı
PROF. DR. FERHAN ÇEBİ
Tez No
723330
Software defect prediction with a personalization focus and challenges during deployment
Kişiselleştirme odaklı yazılım hata tahmini ve entegrasyon zorlukları
BEYZA EKEN
Doktora
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol İstanbul Teknik Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ AYŞE TOSUN KÜHN

Geri Dön