Ridge regresyonda sapma parametresi k'nın elde edilmesinde genetik algoritma yaklaşımı
An approach based on genetic algorithm for finding an optimal biasing parameter k in ridge regression
- Tez No: 354445
- Danışmanlar: DOÇ. DR. VEDİDE REZAN USLU
- Tez Türü: Yüksek Lisans
- Konular: İstatistik, Statistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2014
- Dil: Türkçe
- Üniversite: Ondokuz Mayıs Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: İstatistik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 97
Özet
Çoklu regresyon analizinde, açıklayıcı değişkenler arasında ilişki yoktur varsayımının bozulması durumunda“çoklu bağlantı sorunu”olarak adlandırılan sorun ortaya çıkar. Bu sorunun en olumsuz etkisi en küçük kareler tahmin edicilerinin varyanslarının olması gerektiğinden daha büyük tahmin edilmesidir ki bu durum tahmin edicilerin kararlılığını bozar. Bu olumsuz etkiden kurtulmak için literatürde en yaygın olarak önerilen yöntem Ridge Regresyon yöntemidir. Bu yöntem, sorunlu olan X'X korelasyon matrisinin köşegen elemanlarına sapma parametresi olarak adlandırılan çok küçük pozitif bir 'k' sabiti ekleyip yanlı ancak daha kararlı tahminler üretir. Bu çalışmada, en uygun sapma parametresi olan k değerinin belirlenmesinde genetik algoritmanın kullanıldığı yeni bir yaklaşım sunulmaktadır. Genetik algoritma, kullanıcının belirleyeceği kriterleri göz önüne alarak çok fazla sayıda k değerinin hızlı bir şekilde incelenmesine olanak sağladığından bu alana katkı sağlamaktadır. İki farklı veriye önerilen bu yaklaşım ile literatürde önerilmiş diğer yöntemler uygulanarak sonuçların karşılaştırılması yapılmıştır.
Özet (Çeviri)
In multiple regression analysis, the assumption on explanatory variables says that all explanatory variables are independent each other. When this assumption is ruined, a problem which is called“multicollinearity”is arised. The multicollinearity problem has got many negative effects on the least squares estimates. One of them, which is most important, is to inflate the variances of the least squares estimates. In order to overcome this problem it is recommended in literature to use Ridge Regression method. This method finds the estimates by adding a very small positive constant to the diagonal elements of the ill-conditioned correlation matrix X'X. This makes the estimates biased but they have much smaller variances, which is good. In this study we propose a new approach based on the genetic algorithm to determine the optimal k value in ridge regression. Genetic algorithm provides for us to try very rapidly many k values and find the optimal one very correctly. This makes our approach more contributed one to the subject. Finally the proposed method applied to two different real data sets together with the methods in the literature. Then the results are presented comparatively.
Benzer Tezler
- Penalized stable regression
Cezalandırılmış stabil regresyon
İREM SARIBAŞ
Yüksek Lisans
İngilizce
2024
Matematikİstanbul Teknik ÜniversitesiMatematik Mühendisliği Ana Bilim Dalı
DOÇ. DR. GÜL İNAN
- A taxonomy of artificial neural networks
Yapay sinir ağlari'nin bir taksonomisi
ALP EREN YILMAZ
Yüksek Lisans
İngilizce
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiMatematik Ana Bilim Dalı
PROF. DR. ATABEY KAYGUN
- Cezalandırılmış lojistik regresyon yöntemlerinin karşılaştırılması
Comparison of penalized logistic regression methods
PINAR KILINÇ ÖZARSLAN
- Ridge regresyonda ridge parametresi için önerilen tarama yöntemine dayalı yeni bir tahmin edici
A new estimator based on the search method proposed for the ridge parameter in ridge regression
SELMAN MERMİ
Doktora
Türkçe
2024
İstatistikMuğla Sıtkı Koçman Üniversitesiİstatistik Ana Bilim Dalı
PROF. DR. ÖZGE AKKUŞ