Doğrusal regresyon modellerinde çapraz geçerlik yöntemleri

Cross validation methods in linear regression

PDF İndir

Tez No: 194384
Yazar: ALİ KEREM ULUDAĞ
Danışmanlar: PROF. DR. REHA ALPAR
Tez Türü: Yüksek Lisans
Konular: Biyoistatistik, Biostatistics
Anahtar Kelimeler: Model Seçimi, Çapraz Geçerlik, Asimptotik Tutarlılık, Model Selection, Cross Validation, Asymptotic Consistency
Yıl: 2005
Dil: Türkçe
Üniversite: Hacettepe Üniversitesi
Enstitü: Sağlık Bilimleri Enstitüsü
Ana Bilim Dalı: Biyoistatistik Ana Bilim Dalı
Bilim Dalı: Belirtilmemiş.
Sayfa Sayısı: 80

Özet

Kestirimeyönelik yapılan çalışmalarda en önemli noktalardan birisi doğal olarak doğrukestirim yapabilme özelliğidir. Özellikle sağlık alanında kestirime yönelikkullanılacak bir model ya da yöntemdeki olası hataların yüksek risktaşıyabilecek olması nedeniyle, doğru kestirim çok daha fazla önemkazanmaktadır. Bu nedenle, kestirim amacıyla kullanılacak yöntemlerinkestirim performanslarını değerlendirebilecek etkili bir yönteme ihtiyaçduyulmaktadır. Eldeki verilere en uygun olacak şekilde ve yeni gözlemlerinkestirimi için geliştirilmiş olan bir model, yeni gözlemlerin kestiriminde herzaman çok iyi sonuçlar vermeyebilmektedir. Bu çalışmanın konusu yineeldeki verileri kullanarak, birbirine alternatif modelleri kestirim yetenekleribakımından karşılaştırarak en iyi kestirim yeteneğine sahip modeli seçençapraz geçerlik yöntemleridir. Literatürde, farklı çapraz-geçerlik yöntemleribulunmaktadır. Bunlar içerisinde en yaygın olarak kullanılanları; Birini-dışarıda-bırakma yöntemi, Çok gözlü çapraz-geçerlik yöntemi ve Monte CarloÇapraz Geçerlik yöntemi'dir.Bu çalışmanın amacı, alternatif modeller içerisinde kestirim performansıen iyi olan regresyon modelinin seçimi için kullanılan çapraz geçerlikyöntemlerinin genel tanımını vermek, yöntemleri tanıtmak, kullanılmakta olanfarklı yöntemleri incelemek ve bu yöntemlerin asimptotik tutarlılıkları veperformanslarını farklı durumlar için benzetim verileri ile karşılaştırmaktır. Buamaç doğrultusunda farklı örneklem genişliği ve hata varyansı değerleri içinyapılan benzetim çalışması sonucunda, belirli kısıtlar temelinde MCCVyönteminin doğru regresyon modellerini saptama olasılıkları bakımındandiğer tüm yöntemlerden çok daha iyi bir performansa sahip olduğu fakat buyöntemin modellerin kestirim hatalarının belirlenmesinde kullanılamayacağısaptanmıştır. Modellerin kestirim hatalarının kestirimine ilişkin sonuçlarda ise,MFCV yöntemlerinin hata kestirimleri için yaygın olarak kullanılan LOOCVyöntemine benzer bir performans gösterdiği saptanmıştır.

Özet (Çeviri)

One of the crucial points of predictive studies isobviously the capability of making correct predictions. Correctness of thepredictions gains much more importance for the models to be used inmedicine as an error in such models may contain high risks for individuals.For this reason, a need for an efficient method has been raised in order toevaluate the predictive capabilities of models to be used for prediction. Amodel that is developed to fit to the available observations and to be used forprediction may not give accurate predictive results for new observations. Thescope of this study is to introduce the cross validation methods used tocompare alternative models regarding their predictive capabilities and selectthe model that has the best predictive capability among others just by usingthe available observations. There are different cross-validation methods inthe literature. The most widely used cross validation methods can besummarized as Leave-One-Out Cross-Validation, Multi-Fold Cross-Validationand Monte Carlo Cross Validation method.The aim of this dissertation is to introduce the cross validationmethods used to select the best predictive regression model amongcompeting models, and investigate the characteristics of different cross-validation methods and to compare the asymptotic consistencies andperformances of these methods by simulation. According to the simulationresults conducted for different sample sizes and error variances, MCCVmethod with specific limitations found to be the best method regarding theprobability of selecting the correct model. On the other hand, it has beenfound that this method can?t be used to predict the prediction error of themodel. It has been found in the simulation study that MFCV methods have asimilar performance to more complicated and burdensome LOOCV methodin estimation of the prediction error of the model.

Benzer Tezler

Tez No
950068
Efficient estimation of Shrinkage parameters in fuzzy Ridge and fuzzy Liu regression models using α-cut-based methods under multicollinearity
Çoklu bağıntı durumunda bulanık Ridge ve bulanık Liu regresyon modellerinde α-kesim tabanlı yöntemler kullanılarak Shrinkage parametrelerinin etkin tahmini
AMMAR HOMAIDA
Doktora
İngilizce
2025
İstatistik Gazi Üniversitesi
İstatistik Ana Bilim Dalı
PROF. DR. MERAL EBEGİL
Tez No
827860
Derin öğrenme ve büyük veri analitiği yöntemleriKullanarak Covid-19 yayılımının ileriye dönük tahmini
Forecasting the spread of covid-19 using deep learning and big data analytics methods
CYLAS KIGANDA
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Gazi Üniversitesi
Bilgisayar Bilimleri Ana Bilim Dalı
PROF. DR. MUHAMMET ALİ AKCAYOL
Tez No
366082
Mikrodizilim gen ifade çalışmalarında genelleştirme yöntemlerinin regresyon modelleri üzerine etkisi
The effects of generalization methods on regression models in microarray gene expression studies
SELEN YILMAZ IŞIKHAN
Doktora
Türkçe
2014
Biyoistatistik Hacettepe Üniversitesi
Biyoistatistik Ana Bilim Dalı
PROF. DR. CELAL REHA ALPAR
Tez No
611949
Kopula temelli değişken kümeleme tekniklerinin incelenmesi ve mortalite tahmini uygulaması
Analysis of copula based variable clustering techniques and application of mortality estimation
ZEYNEP İLHAN
Doktora
Türkçe
2019
İstatistik Eskişehir Osmangazi Üniversitesi
İstatistik Ana Bilim Dalı
PROF. DR. VEYSEL YILMAZ
PROF. DR. ŞAHAP KASIRGA YILDIRAK
Tez No
712187
Kentiçi demiryolunda trafik yükünün ray aşınmaları üzerindeki etkisinin araştırılması
Investigation of the effects of traffic load on rail wear in urban railways
HAZAL YILMAZ SÖNMEZ
Doktora
Türkçe
2021
Ulaşım İstanbul Teknik Üniversitesi
İnşaat Mühendisliği Ana Bilim Dalı
PROF. DR. ZÜBEYDE ÖZTÜRK

Geri Dön