Doğrusal regresyon modellerinde çapraz geçerlik yöntemleri
Cross validation methods in linear regression
- Tez No: 194384
- Danışmanlar: PROF. DR. REHA ALPAR
- Tez Türü: Yüksek Lisans
- Konular: Biyoistatistik, Biostatistics
- Anahtar Kelimeler: Model Seçimi, Çapraz Geçerlik, Asimptotik Tutarlılık, Model Selection, Cross Validation, Asymptotic Consistency
- Yıl: 2005
- Dil: Türkçe
- Üniversite: Hacettepe Üniversitesi
- Enstitü: Sağlık Bilimleri Enstitüsü
- Ana Bilim Dalı: Biyoistatistik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 80
Özet
Kestirimeyönelik yapılan çalışmalarda en önemli noktalardan birisi doğal olarak doğrukestirim yapabilme özelliğidir. Özellikle sağlık alanında kestirime yönelikkullanılacak bir model ya da yöntemdeki olası hataların yüksek risktaşıyabilecek olması nedeniyle, doğru kestirim çok daha fazla önemkazanmaktadır. Bu nedenle, kestirim amacıyla kullanılacak yöntemlerinkestirim performanslarını değerlendirebilecek etkili bir yönteme ihtiyaçduyulmaktadır. Eldeki verilere en uygun olacak şekilde ve yeni gözlemlerinkestirimi için geliştirilmiş olan bir model, yeni gözlemlerin kestiriminde herzaman çok iyi sonuçlar vermeyebilmektedir. Bu çalışmanın konusu yineeldeki verileri kullanarak, birbirine alternatif modelleri kestirim yetenekleribakımından karşılaştırarak en iyi kestirim yeteneğine sahip modeli seçençapraz geçerlik yöntemleridir. Literatürde, farklı çapraz-geçerlik yöntemleribulunmaktadır. Bunlar içerisinde en yaygın olarak kullanılanları; Birini-dışarıda-bırakma yöntemi, Çok gözlü çapraz-geçerlik yöntemi ve Monte CarloÇapraz Geçerlik yöntemi'dir.Bu çalışmanın amacı, alternatif modeller içerisinde kestirim performansıen iyi olan regresyon modelinin seçimi için kullanılan çapraz geçerlikyöntemlerinin genel tanımını vermek, yöntemleri tanıtmak, kullanılmakta olanfarklı yöntemleri incelemek ve bu yöntemlerin asimptotik tutarlılıkları veperformanslarını farklı durumlar için benzetim verileri ile karşılaştırmaktır. Buamaç doğrultusunda farklı örneklem genişliği ve hata varyansı değerleri içinyapılan benzetim çalışması sonucunda, belirli kısıtlar temelinde MCCVyönteminin doğru regresyon modellerini saptama olasılıkları bakımındandiğer tüm yöntemlerden çok daha iyi bir performansa sahip olduğu fakat buyöntemin modellerin kestirim hatalarının belirlenmesinde kullanılamayacağısaptanmıştır. Modellerin kestirim hatalarının kestirimine ilişkin sonuçlarda ise,MFCV yöntemlerinin hata kestirimleri için yaygın olarak kullanılan LOOCVyöntemine benzer bir performans gösterdiği saptanmıştır.
Özet (Çeviri)
One of the crucial points of predictive studies isobviously the capability of making correct predictions. Correctness of thepredictions gains much more importance for the models to be used inmedicine as an error in such models may contain high risks for individuals.For this reason, a need for an efficient method has been raised in order toevaluate the predictive capabilities of models to be used for prediction. Amodel that is developed to fit to the available observations and to be used forprediction may not give accurate predictive results for new observations. Thescope of this study is to introduce the cross validation methods used tocompare alternative models regarding their predictive capabilities and selectthe model that has the best predictive capability among others just by usingthe available observations. There are different cross-validation methods inthe literature. The most widely used cross validation methods can besummarized as Leave-One-Out Cross-Validation, Multi-Fold Cross-Validationand Monte Carlo Cross Validation method.The aim of this dissertation is to introduce the cross validationmethods used to select the best predictive regression model amongcompeting models, and investigate the characteristics of different cross-validation methods and to compare the asymptotic consistencies andperformances of these methods by simulation. According to the simulationresults conducted for different sample sizes and error variances, MCCVmethod with specific limitations found to be the best method regarding theprobability of selecting the correct model. On the other hand, it has beenfound that this method can?t be used to predict the prediction error of themodel. It has been found in the simulation study that MFCV methods have asimilar performance to more complicated and burdensome LOOCV methodin estimation of the prediction error of the model.
Benzer Tezler
- Derin öğrenme ve büyük veri analitiği yöntemleriKullanarak Covid-19 yayılımının ileriye dönük tahmini
Forecasting the spread of covid-19 using deep learning and big data analytics methods
CYLAS KIGANDA
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilgisayar Bilimleri Ana Bilim Dalı
PROF. DR. MUHAMMET ALİ AKCAYOL
- Mikrodizilim gen ifade çalışmalarında genelleştirme yöntemlerinin regresyon modelleri üzerine etkisi
The effects of generalization methods on regression models in microarray gene expression studies
SELEN YILMAZ IŞIKHAN
Doktora
Türkçe
2014
BiyoistatistikHacettepe ÜniversitesiBiyoistatistik Ana Bilim Dalı
PROF. DR. CELAL REHA ALPAR
- Kopula temelli değişken kümeleme tekniklerinin incelenmesi ve mortalite tahmini uygulaması
Analysis of copula based variable clustering techniques and application of mortality estimation
ZEYNEP İLHAN
Doktora
Türkçe
2019
İstatistikEskişehir Osmangazi Üniversitesiİstatistik Ana Bilim Dalı
PROF. DR. VEYSEL YILMAZ
PROF. DR. ŞAHAP KASIRGA YILDIRAK
- Kentiçi demiryolunda trafik yükünün ray aşınmaları üzerindeki etkisinin araştırılması
Investigation of the effects of traffic load on rail wear in urban railways
HAZAL YILMAZ SÖNMEZ
Doktora
Türkçe
2021
Ulaşımİstanbul Teknik Üniversitesiİnşaat Mühendisliği Ana Bilim Dalı
PROF. DR. ZÜBEYDE ÖZTÜRK
- TIMSS 2019 fen ve matematik başarısının makine öğrenmesi modelleriyle incelenmesi
Investigation of TIMSS 2019 science and mathematics achievement with machine learning models
FURKAN DEVECİ
Yüksek Lisans
Türkçe
2024
Eğitim ve ÖğretimAtatürk ÜniversitesiMatematik ve Fen Bilimleri Ana Bilim Dalı
PROF. DR. FATİH SEZEK