Geri Dön

Doğrusal regresyon modellerinde çapraz geçerlik yöntemleri

Cross validation methods in linear regression

  1. Tez No: 194384
  2. Yazar: ALİ KEREM ULUDAĞ
  3. Danışmanlar: PROF. DR. REHA ALPAR
  4. Tez Türü: Yüksek Lisans
  5. Konular: Biyoistatistik, Biostatistics
  6. Anahtar Kelimeler: Model Seçimi, Çapraz Geçerlik, Asimptotik Tutarlılık, Model Selection, Cross Validation, Asymptotic Consistency
  7. Yıl: 2005
  8. Dil: Türkçe
  9. Üniversite: Hacettepe Üniversitesi
  10. Enstitü: Sağlık Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Biyoistatistik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 80

Özet

Kestirimeyönelik yapılan çalışmalarda en önemli noktalardan birisi doğal olarak doğrukestirim yapabilme özelliğidir. Özellikle sağlık alanında kestirime yönelikkullanılacak bir model ya da yöntemdeki olası hataların yüksek risktaşıyabilecek olması nedeniyle, doğru kestirim çok daha fazla önemkazanmaktadır. Bu nedenle, kestirim amacıyla kullanılacak yöntemlerinkestirim performanslarını değerlendirebilecek etkili bir yönteme ihtiyaçduyulmaktadır. Eldeki verilere en uygun olacak şekilde ve yeni gözlemlerinkestirimi için geliştirilmiş olan bir model, yeni gözlemlerin kestiriminde herzaman çok iyi sonuçlar vermeyebilmektedir. Bu çalışmanın konusu yineeldeki verileri kullanarak, birbirine alternatif modelleri kestirim yetenekleribakımından karşılaştırarak en iyi kestirim yeteneğine sahip modeli seçençapraz geçerlik yöntemleridir. Literatürde, farklı çapraz-geçerlik yöntemleribulunmaktadır. Bunlar içerisinde en yaygın olarak kullanılanları; Birini-dışarıda-bırakma yöntemi, Çok gözlü çapraz-geçerlik yöntemi ve Monte CarloÇapraz Geçerlik yöntemi'dir.Bu çalışmanın amacı, alternatif modeller içerisinde kestirim performansıen iyi olan regresyon modelinin seçimi için kullanılan çapraz geçerlikyöntemlerinin genel tanımını vermek, yöntemleri tanıtmak, kullanılmakta olanfarklı yöntemleri incelemek ve bu yöntemlerin asimptotik tutarlılıkları veperformanslarını farklı durumlar için benzetim verileri ile karşılaştırmaktır. Buamaç doğrultusunda farklı örneklem genişliği ve hata varyansı değerleri içinyapılan benzetim çalışması sonucunda, belirli kısıtlar temelinde MCCVyönteminin doğru regresyon modellerini saptama olasılıkları bakımındandiğer tüm yöntemlerden çok daha iyi bir performansa sahip olduğu fakat buyöntemin modellerin kestirim hatalarının belirlenmesinde kullanılamayacağısaptanmıştır. Modellerin kestirim hatalarının kestirimine ilişkin sonuçlarda ise,MFCV yöntemlerinin hata kestirimleri için yaygın olarak kullanılan LOOCVyöntemine benzer bir performans gösterdiği saptanmıştır.

Özet (Çeviri)

One of the crucial points of predictive studies isobviously the capability of making correct predictions. Correctness of thepredictions gains much more importance for the models to be used inmedicine as an error in such models may contain high risks for individuals.For this reason, a need for an efficient method has been raised in order toevaluate the predictive capabilities of models to be used for prediction. Amodel that is developed to fit to the available observations and to be used forprediction may not give accurate predictive results for new observations. Thescope of this study is to introduce the cross validation methods used tocompare alternative models regarding their predictive capabilities and selectthe model that has the best predictive capability among others just by usingthe available observations. There are different cross-validation methods inthe literature. The most widely used cross validation methods can besummarized as Leave-One-Out Cross-Validation, Multi-Fold Cross-Validationand Monte Carlo Cross Validation method.The aim of this dissertation is to introduce the cross validationmethods used to select the best predictive regression model amongcompeting models, and investigate the characteristics of different cross-validation methods and to compare the asymptotic consistencies andperformances of these methods by simulation. According to the simulationresults conducted for different sample sizes and error variances, MCCVmethod with specific limitations found to be the best method regarding theprobability of selecting the correct model. On the other hand, it has beenfound that this method can?t be used to predict the prediction error of themodel. It has been found in the simulation study that MFCV methods have asimilar performance to more complicated and burdensome LOOCV methodin estimation of the prediction error of the model.

Benzer Tezler

  1. Derin öğrenme ve büyük veri analitiği yöntemleriKullanarak Covid-19 yayılımının ileriye dönük tahmini

    Forecasting the spread of covid-19 using deep learning and big data analytics methods

    CYLAS KIGANDA

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgisayar Bilimleri Ana Bilim Dalı

    PROF. DR. MUHAMMET ALİ AKCAYOL

  2. Mikrodizilim gen ifade çalışmalarında genelleştirme yöntemlerinin regresyon modelleri üzerine etkisi

    The effects of generalization methods on regression models in microarray gene expression studies

    SELEN YILMAZ IŞIKHAN

    Doktora

    Türkçe

    Türkçe

    2014

    BiyoistatistikHacettepe Üniversitesi

    Biyoistatistik Ana Bilim Dalı

    PROF. DR. CELAL REHA ALPAR

  3. Kopula temelli değişken kümeleme tekniklerinin incelenmesi ve mortalite tahmini uygulaması

    Analysis of copula based variable clustering techniques and application of mortality estimation

    ZEYNEP İLHAN

    Doktora

    Türkçe

    Türkçe

    2019

    İstatistikEskişehir Osmangazi Üniversitesi

    İstatistik Ana Bilim Dalı

    PROF. DR. VEYSEL YILMAZ

    PROF. DR. ŞAHAP KASIRGA YILDIRAK

  4. Kentiçi demiryolunda trafik yükünün ray aşınmaları üzerindeki etkisinin araştırılması

    Investigation of the effects of traffic load on rail wear in urban railways

    HAZAL YILMAZ SÖNMEZ

    Doktora

    Türkçe

    Türkçe

    2021

    Ulaşımİstanbul Teknik Üniversitesi

    İnşaat Mühendisliği Ana Bilim Dalı

    PROF. DR. ZÜBEYDE ÖZTÜRK

  5. TIMSS 2019 fen ve matematik başarısının makine öğrenmesi modelleriyle incelenmesi

    Investigation of TIMSS 2019 science and mathematics achievement with machine learning models

    FURKAN DEVECİ

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Eğitim ve ÖğretimAtatürk Üniversitesi

    Matematik ve Fen Bilimleri Ana Bilim Dalı

    PROF. DR. FATİH SEZEK