Geri Dön

Ridge, LASSO and elastic net methods in high dimensional data

Yüksek boyutlu verilerde ridge, LASSO ve elastik net yöntemleri

  1. Tez No: 641128
  2. Yazar: MURAT GENÇ
  3. Danışmanlar: PROF. DR. MAHMUDE REVAN ÖZKALE ATICIOĞLU
  4. Tez Türü: Doktora
  5. Konular: İstatistik, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2020
  8. Dil: İngilizce
  9. Üniversite: Çukurova Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 187

Özet

Günümüzde büyük ve yüksek boyutlu veri kümelerinin ortaya çıkması ile yüksek ön tahmin doğruluğuna sahip olmasının yanı sıra kolay yorumlanabilen modeller veren cezalandırılmış doğrusal regresyon yöntemleri büyük önem kazanmıştır. Bu çalışmada öncelikle literatürde yaygın olarak bilinen ridge, LASSO ve iki parametreli tahmin ve elastik net yöntemleri, cezalandırılmış doğrusal regresyon yöntemleri bağlamında ele alınmış ve bu yöntemlere dair temel bilgiler verilmiştir. Bir sonraki aşamada veri kümesinde çoklu iç ilişki olması halinde bu yöntemlere alternatif olarak GO tahmin edicisi önerilmiştir. Daha sonra veri kümesinde çoklu iç ilişki olmasının yanı sıra veri kümesinin yüksek boyutlu olması halinde de model oluşturmada kullanılabilen shift-ridge ve shift-LASSO tahmin edicileri önerilmiştir. Son olarak veri kümesine uygun stokastik kısıtların olması durumunda alternatif bir tahmin edici olarak kullanılabilen stokastik kısıtlı LASSO tahmin edicisi önerilmiştir. Her bir tahmin edici için gerçek veri kümesi analizi ve simülasyon çalışmaları yapılmıştır. Önerilen tahmin ediciler, test kümesi hata kareler ortalaması ve seçilen değişken sayısı gibi kriterlere göre C++ ve R programlama dilleri kullanılarak literatürde bulunan diğer tahmin ediciler ile karşılaştırılmıştır.

Özet (Çeviri)

Penalized linear regression methods that yield interpretable models with high prediction accuracy have gained great importance with the emergence of big and high-dimensional data sets recently. In this study, firstly, the ridge, LASSO, two-parameter estimation and elastic net methods which are popular methods in the literature are discussed in the context of penalized linear regression methods. In the next stage, the GO estimator is proposed as an alternative to these methods in case there is multicollinearity in the data set. After that, the shift-ridge and shift-LASSO estimators are proposed which can be used in modeling if the data set is high-dimensional in addition to having multicollinearity. Finally, the stochastic restricted LASSO estimator is proposed, which can be used as an alternative estimator if there are convenient stochastic restrictions for the data set. Real data set analysis and simulation studies are performed for each estimator. The proposed estimators are compared with other estimators in the literature by making use of C++ and R programming languages according to criteria such as test mean squared error and number of variables selected.

Benzer Tezler

  1. Çok boyutlu lineer regresyonda robust ve sparse tahmin metotlarının zooteknide kullanımı

    Usage of robust and sparse estimation methods for high-dimensional linear regression in animal science

    CEM TIRINK

    Doktora

    Türkçe

    Türkçe

    2020

    BiyoistatistikOndokuz Mayıs Üniversitesi

    Zootekni Ana Bilim Dalı

    PROF. DR. HASAN ÖNDER

  2. Doğrusal regresyonda ridge, lasso ve elastik net yöntemlerinin sağlık alanında uygulanması

    Application of ridge, lasso and elastic net methods in linear regression in the field of health

    MERVE VERGİLİ

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    BiyoistatistikSüleyman Demirel Üniversitesi

    Biyoistatistik ve Tıbbi Bilişim Ana Bilim Dalı

    PROF. DR. HİKMET ORHAN

  3. Çoklu bağlantı durumunda sıralı lojistik regresyon modellerinde yöntemlerin karşılaştırılması

    Comparison of ordinal logistic regression models in multicollinearity situation

    ONUR BAYRAM

    Doktora

    Türkçe

    Türkçe

    2022

    İstatistikMimar Sinan Güzel Sanatlar Üniversitesi

    İstatistik Ana Bilim Dalı

    PROF. DR. EYLEM DENİZ HOWE

  4. Diffüz optik tomografi sistemlerinde ters problem çözümü için yeni yöntemler

    Novel methods for inverse problem solution in diffuse optical tomography systems

    SİNEM UYSAL

    Doktora

    Türkçe

    Türkçe

    2023

    Elektrik ve Elektronik MühendisliğiYıldız Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    DOÇ. DR. UMUT ENGİN AYTEN

  5. Comparison of regression methods to handle overfitting in machine learning

    Makine öğreniminde aşırı uyum problemini çözmek için kullanılan regresyon yöntemlerinin karşılaştırılması

    SHUBAR SAHIB JAWAD AL-KHAIAT

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    İstatistikOndokuz Mayıs Üniversitesi

    İstatistik Ana Bilim Dalı

    PROF. DR. MEHMET ALİ CENGİZ