Geri Dön

Yüksek boyutlu robust regresyonunda makine öğrenmesi algoritmaları: Simülasyon ve uygulama

Machine learning algorithms in high dimensional robust regression: Simulation and application

  1. Tez No: 741114
  2. Yazar: KADRİYE HİLAL TOPAL
  3. Danışmanlar: PROF. DR. EBRU ÇAĞLAYAN AKAY
  4. Tez Türü: Doktora
  5. Konular: Ekonometri, Econometrics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: Türkçe
  9. Üniversite: Marmara Üniversitesi
  10. Enstitü: Sosyal Bilimler Enstitüsü
  11. Ana Bilim Dalı: Ekonometri Ana Bilim Dalı
  12. Bilim Dalı: Ekonometri Bilim Dalı
  13. Sayfa Sayısı: 155

Özet

Bu tezin amacı aşırı değer ve kaldıraç noktalarına sahip yüksek boyutlu veri yapısının kullanıldığı modelleri farklı robust yöntemlerle tahmin etmek ve performanslarını karşılaştırmaktır. Çalışmada RStudio programı kullanılarak nesne tabanlı simülasyon yöntemiyle sadece dikey aşırı değerlerin olduğu, sadece kaldıraç noktalarının olduğu, hem dikey aşırı değer hem de kaldıraç noktalarını olduğu ve hiçbirinin olmadığı 4 farklı veri seti oluşturulmuş ve bu veri setlerine LAD Lasso, Kantil Lasso, Robust LARS, SparseLTS, Huber Lasso ve MTE Lasso robust tahmin yöntemleri uygulanmıştır. Ayrıca tüm yöntemlerin performanslarının gerçek veri setinde araştırılması amacıyla Genişletilmiş Çevresel Kuznets Eğrisi hipotezi altında 2000, 2010 ve 2018 yılları için OECD ülkelerinde karbondioksit emisyonunu etkileyen faktörlerin yer aldığı yüksek boyutlu veri setleri oluşturulmuştur. Bu veri setlerindeki dikey aşırı değer ve kaldıraç noktalarının varlığı tanımlayıcı testler ile araştırılmıştır ve sonrasında bu veri setleriyle oluşturulan modeller çalışmada kullanılan robust yöntemlerle tahmin edilmiştir. Hem simülasyon hem de gerçek veri setlerinde kullanılan robust tahmin yöntemlerinin performans karşılaştırılması çeşitli metriklere dayanarak yapılmış ve sonuçlar tablolarla sunulmuştur. Sonuç olarak simülasyon çalışmalarında, yüksek boyutlu modellerde aşırı değerlerin olmaması ve dikey aşırı değerlerin olması durumunda Robust LARS, kaldıraç noktalarının olması ve hem dikey aşırı değerlerin hem de kaldıraç noktalarının olması durumunda Sparse LTS yöntemleri daha iyi performans göstermiştir. Uygulamada ise simülasyon çalışmasıyla benzer sonuçlar elde edilmiştir.

Özet (Çeviri)

The aim of this thesis is to predict models using high-dimensional data structure with outliers and leverage points via different robust methods and compare their performance. In the study, using the RStudio program, 4 different data sets with only vertical outliers, only leverage points, both vertical outliers and leverage points and none of them were created with object oriented simulation method and LAD Lasso, Kantil Lasso, Robust LARS, SparseLTS, Huber Lasso and MTE Lasso robust estimation methods were applied to these data sets. In addition, in order to investigate the performances of all methods in real data set, high-dimensional data sets were created under the Augmented Environmental Kuznets Curve hypothesis for 2000, 2010 and 2018, including the factors affecting carbon dioxide emissions in OECD countries. The existence of outliers and leverage points in these datasets were investigated by diagnostic tests, and then the models created with these datasets were estimated with the robust methods used in the study. Performance comparisons of robust estimation methods used in both simulation and real data sets were made based on various metrics and the results were presented in tables. As a result, in simulation studies, Robust LARS methods overperform in case of no outliers and existing vertical outliers in high-dimensional models, and Sparse LTS methods in case of only leverage points and both vertical outliers and leverage points. In application, similar results were obtained with the simulation study.

Benzer Tezler

  1. Modelling and state of charge estimation of lithium-ion batteries

    Lityum bazlı batarya hücrelerininmodelleme ve şarj durumu tahmini

    MANİ KAZIMI

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Kontrol ve Otomasyon Mühendisliği Ana Bilim Dalı

    PROF. DR. METİN GÖKAŞAN

  2. A new contribution to nonlinear robust regression and classification with MARS and its applications to data mining for quality control in manufacturing

    Doğrusal olmayan sağlam regresyon ve sınıflandırmaya MARS ile yeni bir katkı ve bu katkının endüstride kalite kontrolü amaçlı veri madenciliği uygulamaları

    FATMA YERLİKAYA

    Yüksek Lisans

    İngilizce

    İngilizce

    2008

    Bilim ve TeknolojiOrta Doğu Teknik Üniversitesi

    Bilimsel Hesaplama Ana Bilim Dalı

    DOÇ. DR. İNCİ BATMAZ

    PROF. DR. GERHARD WİLHELM WEBER

  3. Investigating the effects of representation learning on exploration in on-policy reinforcement learning

    Temsil öğrenmesinin politikalı pekiştirmeli öğrenmedeki keşif üzerindeki etkilerinin incelenmesi

    CAN GÖZPINAR

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKoç Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ BARIŞ AKGÜN

  4. Visualization based analysis of gene networks using high dimensional model representation

    Yüksek boyutlu model gösterilim kullanılarak gen ağlarının görselleştirme tabanlı analizi

    PINAR GÜLER

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Hesaplamalı Bilimler ve Mühendislik Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ SÜHA TUNA

  5. Robust trajectory optimization of constrained re-entry flight via stochastic collocation based ensemble pseudospectral optimal control

    Stokastik kolokasyona dayalı ensemble pseudospectral optimal kontrol ile kısıtlı yeniden giriş uçuşunun gürbüz yörünge eniyilemesi

    AKAN SELİM

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Astronomi ve Uzay Bilimleriİstanbul Teknik Üniversitesi

    Uçak ve Uzay Mühendisliği Ana Bilim Dalı

    PROF. DR. İBRAHİM OZKOL