Geri Dön

İnsan ömrü kestiriminde ridge, lasso ve elastic net regresyon tahmin edicileri ve karşılaştırmaları üzerine bir çalışma

A study on predictors and comparisons of ridge, lasso and elastic net regression in estimating human lifespan

  1. Tez No: 965510
  2. Yazar: KADİR YILMAZ
  3. Danışmanlar: DOÇ. DR. OSMAN UFUK EKİZ
  4. Tez Türü: Yüksek Lisans
  5. Konular: İstatistik, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2025
  8. Dil: Türkçe
  9. Üniversite: Gazi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 50

Özet

Regresyon analizi, iki veya daha fazla nicel değişken arasındaki ilişkiyi kullanarak bir değişkeni diğer değişkenler aracılığıyla kestirmek için başvurulan istatistiksel bir yöntemdir. Regresyon modellerinde parametre tahmini yapmak için en sık kullanılan yöntem en küçük kareler yöntemidir. Bu yöntemde temel amaç, gerçek değerler ile model tarafından kestirimde bulunulan değerler arasındaki farklara dayalı hata kareler toplamını minimize etmektir. Bu sayede modelin gerçek değerlere en yakın kestirimlerde bulunması amaçlanmaktadır. Ancak veri setinde yer alan bağımsız değişkenler arasında yüksek ilişki (korelasyon) olduğu durumlarda bu yöntem güvenilir sonuçlar vermemektedir. Bu duruma çoklu doğrusal bağlantı sorunu denilmektedir. Bu sorun nedeniyle hangi bağımsız değişkenin regresyon modeli için en önemli olduğu belirlenememekte, regresyon katsayılarının işaretleri değişebilmekte, aynı veri setinden farklı tahminler elde edilebilmektedir ve modelin tahmin performansı düşmektedir. Bu nedenlerden dolayı en küçük kareler yerine düzenlileştirme yöntemleri yani Ridge, Lasso ve Elastic Net regresyon yöntemleri kullanılmaktadır. Bu yöntemler hata kareler toplamı olarak isimlendirilip minimize edilmek istenen amaç fonksiyonuna ceza terimi ekleyerek regresyon katsayılarını sınırlamaktadır. Bu çalışmada Dünya Sağlık Örgütünün Küresel Sağlık Gözlemevi veri havuzundan elde edilen 2000-2015 yılları arasındaki 141 ülkeye ait 2.244 çaplı sağlık verileri kullanılmış ve ayrıca MATLAB programında 100 farklı senaryoda simülasyon yapılarak düzenlileştirme yöntemlerinden hangisinin kestirim becerisinin daha güvenilir olduğu irdelenmiştir. Gerçek veri için yapılan çalışmada Lasso regresyon diğer yöntemlerden daha yüksek tahmin performansı vermiştir. Simülasyon çalışmasında ise hata kareler ortalama değerleri incelendiğinde Elastic Net regresyon ve Lasso regresyon yöntemleri daha güvenilir sonuçlar ortaya koymuştur. Genel olarak sonuçlar irdelendiğinde ise MATLAB veya benzeri programlama ortamlarında yapılacak çalışmalarda özellikle bağımsız değişken sayısının fazla olduğu karmaşık veri setlerinde Elastic Net regresyon, değişken sayısının az olduğu durumlarda ise Lasso regresyon yönteminin tercih edilmesinin daha uygun olacağı sonucuna varılmıştır.

Özet (Çeviri)

Regression analysis is a statistical method used to predict a variable through other variables by utilizing the relationship between two or more quantitative variables. The most commonly used method for parameter estimation in regression models is the least squares method. The primary goal of this method is to minimize the sum of squared errors, which is based on the differences between the actual values and the values predicted by the model. This ensures that the model provides predictions that are as close as possible to the actual values. However, when there is a high correlation among the independent variables in the dataset, this method does not yield reliable results. This is referred to as the problem of multicollinearity. Due to this issue, it becomes difficult to determine which independent variable is the most important for the regression model, the signs of the regression coefficients can change, different estimates may be obtained from the same dataset, and the model's prediction performance declines. For these reasons, instead of least squares, regularization methods such as Ridge, Lasso, and Elastic Net regression are used. These methods limit the regression coefficients by adding a penalty term to the objective function, which is referred to as the sum of squared errors, and aim to minimize it. In this study, health data comprising 2,244 variables from 141 countries between 2000 and 2015, obtained from the World Health Organization's Global Health Observatory data repository, were used. Additionally, 100 different scenarios were simulated in MATLAB to examine which regularization method provides more reliable predictive performance In the study conducted on real data, the Lasso regression provided higher prediction performance compared to other methods. In the simulation study, when examining the mean squared error values, Elastic Net regression and Lasso regression methods yielded more reliable results. When the results are evaluated overall, it is concluded that in studies conducted using MATLAB or similar programming environments, the Elastic Net regression method is more suitable for complex datasets with a large number of independent variables, whereas the Lasso regression method is preferable when the number of variables is small.

Benzer Tezler

  1. Convolutional neural network based partial discharge pattern classification of medium voltage cable terminations

    Orta gerilim kablo başlıklarında evrişimli sinir ağları ile kısmi boşalma örüntü sınıflandırılması

    HALİL İBRAHİM ÜÇKOL

    Yüksek Lisans

    İngilizce

    İngilizce

    2020

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. AYDOĞAN ÖZDEMİR

  2. Development of an effective kinematic synthesis and admittance control methodology for rehabilitation robotics

    Robotik rehabilitasyon için etkili bir kinematik sentez ve admitans kontrol yönteminin geliştirilmesi

    MERTCAN KOÇAK

    Yüksek Lisans

    İngilizce

    İngilizce

    2020

    Mekatronik Mühendisliğiİzmir Katip Çelebi Üniversitesi

    Makine Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ERKİN GEZGİN

    DR. ÖĞR. ÜYESİ ÖZGÜN BAŞER

  3. Development of antibacterial coatings on titanium based biomaterials

    Titanyum esaslı biyomalzemeler üzerinde antibakteriyel kaplamalar geliştirilmesi

    DİLEK TEKER AYDOĞAN

    Doktora

    İngilizce

    İngilizce

    2022

    Biyomühendislikİstanbul Teknik Üniversitesi

    Nanobilim ve Nanomühendislik Ana Bilim Dalı

    PROF. DR. HÜSEYİN ÇİMENOĞLU

  4. 0-6 yaş grubu çocuk kitap illüstrasyonlarının analizi ve bir çocuk kitabı illüstrasyonu denemesi

    Başlık çevirisi yok

    HANDAN BARAL

    Yüksek Lisans

    Türkçe

    Türkçe

    1989

    Güzel SanatlarHacettepe Üniversitesi

    Uygulamalı Sanatlar Ana Sanat Dalı

    DOÇ. HÜSEYİN BİLGİN

  5. Türkiye'de yetişkinlerin teknoloji yoğun ortamlarda problem çözme becerisine yönelik bir yapısal eşitlik modeli

    A structural equality model for adults' problem solving skills in technology-rich environments in Turkey

    BATUHAN CİCİKLER

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Eğitim ve ÖğretimAnkara Üniversitesi

    Bilgisayar ve Öğretim Teknolojileri Eğitimi Ana Bilim Dalı

    DOÇ. DR. HAYRİYE TUĞBA ÖZTÜRK