İstatistiksel daraltıcı yöntemlerden ridge regresyon, lasso regresyon ve elastik net regresyonun tahminleme ve sınıflandırma performanslarının karşılaştırılması
Compare of estimation and classification performances of statistical shrinkage methods ridge regression, lasso regression and elastic net regression
- Tez No: 695927
- Danışmanlar: PROF. DR. FEZAN MUTLU
- Tez Türü: Yüksek Lisans
- Konular: Biyoistatistik, Biostatistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2021
- Dil: Türkçe
- Üniversite: Eskişehir Osmangazi Üniversitesi
- Enstitü: Sağlık Bilimleri Enstitüsü
- Ana Bilim Dalı: Biyoistatistik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 98
Özet
Amaç: Veri bilimindeki gelişmeler, çok boyutlu veri setlerinde bağımsız değişken sayısının gözlem sayısından büyük olduğu durumlarda regresyon modelleri ile yapılan tahminlerin güvenilirliğin artırılmasının gerekli olduğunu göstermektedir. Değişkenler arasındaki çoklu bağıntı, EKK tahminin doğruluğunu azaltmaktadır. Bu tez çalışmasında, çoklu bağıntı durumunda ve çok boyutlu veri setinde temel istatistiksel daraltıcı yöntemlerden olan Ridge Regresyon, Lasso Regresyon ve Elastik Net Regresyon yöntemlerinden en iyi performansa sahip olan yöntem simülasyon çalışması yapılarak belirlenmesi amaçlanmıştır. Göğüs kanserinin erken teşhisinde kullanılar miRNA'ların İstatistiksel Daraltıcı Yöntemler kullanılarak sınıflandırılmıştır. Yöntem: Yöntemlerin tahminleme ve sınıflama performansları türetilmiş veri setlerinde gözlem sayısının değişken sayısından büyük olduğu ve gözlem sayısının değişken sayısından küçük olduğu senaryolar için çoklu bağıntının az- orta- çok yüksek dereceli olduğu durumlarda değerlendirilmiştir. Daha sonra GSE73002 koduyla Gene Expression Omnibus (GEO) veri tabanında bulunan veri seti ile Ridge, Lasso ve Elastik Net Regresyon yöntemleri ile göğüs kanseri teşhisi için biyobelirteç olan miRNA' lar için model tahmini yapılmıştır. Bulgular: Yapılan analizler sonucunda, İstatistiksel Daraltıcı Yöntemler olan Ridge Regresyon, Lasso Regresyon ve Elastik Net Regresyon yöntemlerinin lineer ve lojistik modellerde tahminleme ve sınıflama çalışmalarında doğru ve güvenilir yöntemler olarak kullanılabileceği görülmüştür. Sağlık alanında yapılan çalışmalarda istatistiksel daraltıcı yöntemlerin geliştirilerek daha doğru modeller elde edilmesi için bu çalışmanın bir temel oluşturacağı düşünülmektedir.
Özet (Çeviri)
Introduction: As the area of data science advances, it becomes clear that estimation reliability using regression models must be created. Multicollinearity reduces the accuracy of Mean Square Estimation (MLE). We aim that the performance of three key Statistical Shrinkage Methods, Ridge Regression, Lasso Regression, and Elastic Net Regression, was compared in this thesis using a simulation exercise. The miRNAs used in the early detection of breast cancer were classified using Statistical Shirinkage Methods. Method: Simulated data sets with variables larger than sample size and variables less than sample size for low, medium, and high levels of multicollinearity were used to assess the prediction and classification capability of these three techniques. Then, using Ridge Regression, Lasso Regression, and Elastic Net Regression, we predicted miRNA biomarkers for breast cancer early detection. The data set for the prediction model came from the Gene Expression Omnibus (GEO) database, with the code GSE73002. Conclusion: According to the findings, Statistical Shrinkage Methods such as Ridge Regression, Lasso Regression, and Elastic Net Regression are reliable and useful methods for prediction and classification research on linear and logistic models. The Statistical Shirinkage Methods may be enhanced at health sience to generate more strong models, according to this study.
Benzer Tezler
- Essays on model averaging and forecasting
Model ortalaması ve tahmin üzerine analizler
HAKAN GÜNEŞ
Doktora
İngilizce
2024
EkonomiOrta Doğu Teknik Üniversitesiİktisat Ana Bilim Dalı
DOÇ. DR. DİLEM YILDIRIM KASAP
- Nafazolin hidroklorür'ün elektrokimyasal davranışı ve adsorptif sıyırma yöntemiyle tayini
Electrochemical behavior of naphazoline hydrochloride and determination by adsorptive stripping method
TUĞÇE ÇETİNKOL
- Geostatistical evaluation of lead and zinc ore body in Balya-Hastanetepe mine in Turkey
Balya-Hastanetepe kurşun-çinko madeninin jeoistatistiksel yöntemlerle değerlendirilmesi
EZGİ TOKA
Yüksek Lisans
İngilizce
2015
Jeoloji Mühendisliğiİstanbul Teknik ÜniversitesiMaden Mühendisliği Ana Bilim Dalı
DOÇ. DR. CÜNEYT ATİLLA ÖZTÜRK
- Kınalı keklik (alectoris chukar) harder bezinin alternatif organ olarak bursa fabricii'nin gelişim ve involüsyon dönemleriyle ilişkisinin histolojik ve histokimyasal yöntemlerle araştırılması
Investigations on the harderian gland which is a functionally alternative to bursa of fabricius of partridge (alectoris chukar) in relation to developmental and involution periods of bursa of fabricius, by histological and histochemical methods
HATİCE YAREN KULOĞLU
Doktora
Türkçe
2016
Histoloji ve EmbriyolojiSelçuk ÜniversitesiHistoloji ve Embriyoloji Ana Bilim Dalı
DOÇ. DR. MURAT BOYDAK
- Gebe sıçanlara uygulanan diklofenak sodyumun postnatal uterus üzerine etkilerinin araştırılması: Stereolojik bir çalışma
An inrestigations on prenatal effects of diclofenac sodium of the pregnant rat of morphomety of uterus: A streological study
ŞEHRİ KARAKOÇ
Yüksek Lisans
Türkçe
2010
Histoloji ve EmbriyolojiYüzüncü Yıl ÜniversitesiTıbbi Histoloji ve Embriyoloji Ana Bilim Dalı
PROF. DR. MURAT ÇETİN RAĞBETLİ