İstatistiksel daraltıcı yöntemlerden ridge regresyon, lasso regresyon ve elastik net regresyonun tahminleme ve sınıflandırma performanslarının karşılaştırılması
Compare of estimation and classification performances of statistical shrinkage methods ridge regression, lasso regression and elastic net regression
- Tez No: 695927
- Danışmanlar: PROF. DR. FEZAN MUTLU
- Tez Türü: Yüksek Lisans
- Konular: Biyoistatistik, Biostatistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2021
- Dil: Türkçe
- Üniversite: Eskişehir Osmangazi Üniversitesi
- Enstitü: Sağlık Bilimleri Enstitüsü
- Ana Bilim Dalı: Biyoistatistik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 98
Özet
Amaç: Veri bilimindeki gelişmeler, çok boyutlu veri setlerinde bağımsız değişken sayısının gözlem sayısından büyük olduğu durumlarda regresyon modelleri ile yapılan tahminlerin güvenilirliğin artırılmasının gerekli olduğunu göstermektedir. Değişkenler arasındaki çoklu bağıntı, EKK tahminin doğruluğunu azaltmaktadır. Bu tez çalışmasında, çoklu bağıntı durumunda ve çok boyutlu veri setinde temel istatistiksel daraltıcı yöntemlerden olan Ridge Regresyon, Lasso Regresyon ve Elastik Net Regresyon yöntemlerinden en iyi performansa sahip olan yöntem simülasyon çalışması yapılarak belirlenmesi amaçlanmıştır. Göğüs kanserinin erken teşhisinde kullanılar miRNA'ların İstatistiksel Daraltıcı Yöntemler kullanılarak sınıflandırılmıştır. Yöntem: Yöntemlerin tahminleme ve sınıflama performansları türetilmiş veri setlerinde gözlem sayısının değişken sayısından büyük olduğu ve gözlem sayısının değişken sayısından küçük olduğu senaryolar için çoklu bağıntının az- orta- çok yüksek dereceli olduğu durumlarda değerlendirilmiştir. Daha sonra GSE73002 koduyla Gene Expression Omnibus (GEO) veri tabanında bulunan veri seti ile Ridge, Lasso ve Elastik Net Regresyon yöntemleri ile göğüs kanseri teşhisi için biyobelirteç olan miRNA' lar için model tahmini yapılmıştır. Bulgular: Yapılan analizler sonucunda, İstatistiksel Daraltıcı Yöntemler olan Ridge Regresyon, Lasso Regresyon ve Elastik Net Regresyon yöntemlerinin lineer ve lojistik modellerde tahminleme ve sınıflama çalışmalarında doğru ve güvenilir yöntemler olarak kullanılabileceği görülmüştür. Sağlık alanında yapılan çalışmalarda istatistiksel daraltıcı yöntemlerin geliştirilerek daha doğru modeller elde edilmesi için bu çalışmanın bir temel oluşturacağı düşünülmektedir.
Özet (Çeviri)
Introduction: As the area of data science advances, it becomes clear that estimation reliability using regression models must be created. Multicollinearity reduces the accuracy of Mean Square Estimation (MLE). We aim that the performance of three key Statistical Shrinkage Methods, Ridge Regression, Lasso Regression, and Elastic Net Regression, was compared in this thesis using a simulation exercise. The miRNAs used in the early detection of breast cancer were classified using Statistical Shirinkage Methods. Method: Simulated data sets with variables larger than sample size and variables less than sample size for low, medium, and high levels of multicollinearity were used to assess the prediction and classification capability of these three techniques. Then, using Ridge Regression, Lasso Regression, and Elastic Net Regression, we predicted miRNA biomarkers for breast cancer early detection. The data set for the prediction model came from the Gene Expression Omnibus (GEO) database, with the code GSE73002. Conclusion: According to the findings, Statistical Shrinkage Methods such as Ridge Regression, Lasso Regression, and Elastic Net Regression are reliable and useful methods for prediction and classification research on linear and logistic models. The Statistical Shirinkage Methods may be enhanced at health sience to generate more strong models, according to this study.
Benzer Tezler
- Fındık zurufu kompostunun toprak kalitesi üzerine etkisi
The effect of adding of hazelnut husk compost on soil quality
SELAHATTİN AYGÜN
Yüksek Lisans
Türkçe
2015
ZiraatOrdu ÜniversitesiToprak Bilimi ve Bitki Besleme Ana Bilim Dalı
PROF. DR. TAYFUN AŞKIN
- Yaş ve kuru çayda, verim ve önemli kalite parametrelerine sarı çay akarı (Polyphagotarsonemus latus (Banks, 1904)) (Prostigmata: Tarsonemidae)'nın etkisi
Effect of yellow tea mite (Polyphagotarsonemus latus (Banks, 1904))(Prostigmata: Tarsonemidae) on yield and important quality parameters of fresh and dried tea
BİRSEN AŞIK ÇUHADAR
Yüksek Lisans
Türkçe
2015
ZiraatOrdu ÜniversitesiBahçe Bitkileri Ana Bilim Dalı
PROF. DR. SAİM ZEKİ BOSTAN
YRD. DOÇ. DR. RANA AKYAZI
- Onkojenik Hpv genotiplerinin Pcr-elisa yöntemi ile saptanması
Detection of oncogenic hpv genotypes by Pcr-Elisa assay
ALPER KANDİŞER
Tıpta Uzmanlık
Türkçe
2007
MikrobiyolojiAkdeniz ÜniversitesiTıbbi Mikrobiyoloji Ana Bilim Dalı
PROF. DR. MERAL GÜLTEKİN
- Bayan futbolcularda 8 haftalık hazırlık çalışmalarının bazı biyomotorik ve fizyolojik özellikler üzerine etkisinin araştırılması
The investigation of the effects of eight weeks prepara-tory work on some biomotorical and physiological properties of female soccer players
ARİF İMAMOĞLU
Yüksek Lisans
Türkçe
2014
SporOndokuz Mayıs ÜniversitesiBeden Eğitimi ve Spor Ana Bilim Dalı
YRD. DOÇ. DR. MURAT ELİÖZ
- Amlodipin ve valsartan'ın hipertansif hastalarda perilipin, irisin ve adropin seviyelerine etkisi
The effect of amlodipine and valsartan on the level of perilipin, irisin and adropin to hypertensve patients
NERMİN AKKAYA
Yüksek Lisans
Türkçe
2014
BiyokimyaTurgut Özal ÜniversitesiTıbbi Biyokimya Ana Bilim Dalı
DOÇ. DR. HÜSAMETTİN ERDAMAR