Ridge, LASSO and elastic net methods in high dimensional data
Yüksek boyutlu verilerde ridge, LASSO ve elastik net yöntemleri
- Tez No: 641128
- Danışmanlar: PROF. DR. MAHMUDE REVAN ÖZKALE ATICIOĞLU
- Tez Türü: Doktora
- Konular: İstatistik, Statistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2020
- Dil: İngilizce
- Üniversite: Çukurova Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: İstatistik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 187
Özet
Günümüzde büyük ve yüksek boyutlu veri kümelerinin ortaya çıkması ile yüksek ön tahmin doğruluğuna sahip olmasının yanı sıra kolay yorumlanabilen modeller veren cezalandırılmış doğrusal regresyon yöntemleri büyük önem kazanmıştır. Bu çalışmada öncelikle literatürde yaygın olarak bilinen ridge, LASSO ve iki parametreli tahmin ve elastik net yöntemleri, cezalandırılmış doğrusal regresyon yöntemleri bağlamında ele alınmış ve bu yöntemlere dair temel bilgiler verilmiştir. Bir sonraki aşamada veri kümesinde çoklu iç ilişki olması halinde bu yöntemlere alternatif olarak GO tahmin edicisi önerilmiştir. Daha sonra veri kümesinde çoklu iç ilişki olmasının yanı sıra veri kümesinin yüksek boyutlu olması halinde de model oluşturmada kullanılabilen shift-ridge ve shift-LASSO tahmin edicileri önerilmiştir. Son olarak veri kümesine uygun stokastik kısıtların olması durumunda alternatif bir tahmin edici olarak kullanılabilen stokastik kısıtlı LASSO tahmin edicisi önerilmiştir. Her bir tahmin edici için gerçek veri kümesi analizi ve simülasyon çalışmaları yapılmıştır. Önerilen tahmin ediciler, test kümesi hata kareler ortalaması ve seçilen değişken sayısı gibi kriterlere göre C++ ve R programlama dilleri kullanılarak literatürde bulunan diğer tahmin ediciler ile karşılaştırılmıştır.
Özet (Çeviri)
Penalized linear regression methods that yield interpretable models with high prediction accuracy have gained great importance with the emergence of big and high-dimensional data sets recently. In this study, firstly, the ridge, LASSO, two-parameter estimation and elastic net methods which are popular methods in the literature are discussed in the context of penalized linear regression methods. In the next stage, the GO estimator is proposed as an alternative to these methods in case there is multicollinearity in the data set. After that, the shift-ridge and shift-LASSO estimators are proposed which can be used in modeling if the data set is high-dimensional in addition to having multicollinearity. Finally, the stochastic restricted LASSO estimator is proposed, which can be used as an alternative estimator if there are convenient stochastic restrictions for the data set. Real data set analysis and simulation studies are performed for each estimator. The proposed estimators are compared with other estimators in the literature by making use of C++ and R programming languages according to criteria such as test mean squared error and number of variables selected.
Benzer Tezler
- Çok boyutlu lineer regresyonda robust ve sparse tahmin metotlarının zooteknide kullanımı
Usage of robust and sparse estimation methods for high-dimensional linear regression in animal science
CEM TIRINK
Doktora
Türkçe
2020
BiyoistatistikOndokuz Mayıs ÜniversitesiZootekni Ana Bilim Dalı
PROF. DR. HASAN ÖNDER
- Doğrusal regresyonda ridge, lasso ve elastik net yöntemlerinin sağlık alanında uygulanması
Application of ridge, lasso and elastic net methods in linear regression in the field of health
MERVE VERGİLİ
Yüksek Lisans
Türkçe
2023
BiyoistatistikSüleyman Demirel ÜniversitesiBiyoistatistik ve Tıbbi Bilişim Ana Bilim Dalı
PROF. DR. HİKMET ORHAN
- Çoklu bağlantı durumunda sıralı lojistik regresyon modellerinde yöntemlerin karşılaştırılması
Comparison of ordinal logistic regression models in multicollinearity situation
ONUR BAYRAM
Doktora
Türkçe
2022
İstatistikMimar Sinan Güzel Sanatlar Üniversitesiİstatistik Ana Bilim Dalı
PROF. DR. EYLEM DENİZ HOWE
- Diffüz optik tomografi sistemlerinde ters problem çözümü için yeni yöntemler
Novel methods for inverse problem solution in diffuse optical tomography systems
SİNEM UYSAL
Doktora
Türkçe
2023
Elektrik ve Elektronik MühendisliğiYıldız Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
DOÇ. DR. UMUT ENGİN AYTEN
- Comparison of regression methods to handle overfitting in machine learning
Makine öğreniminde aşırı uyum problemini çözmek için kullanılan regresyon yöntemlerinin karşılaştırılması
SHUBAR SAHIB JAWAD AL-KHAIAT
Yüksek Lisans
İngilizce
2022
İstatistikOndokuz Mayıs Üniversitesiİstatistik Ana Bilim Dalı
PROF. DR. MEHMET ALİ CENGİZ