Geri Dön

Robust (dayanıklı) regresyon yöntemleri üzerine bir araştırma

A research on robust regression methods

  1. Tez No: 636174
  2. Yazar: YASİN BÜYÜKKÖR
  3. Danışmanlar: PROF. DR. ALİ KEMAL ŞEHİRLİOĞLU
  4. Tez Türü: Doktora
  5. Konular: Ekonometri, Econometrics
  6. Anahtar Kelimeler: M- Tahminleme Yöntemi, Dayanıklı (Robust) Regresyon, Pearson Tip VI Dağılışı, Etki Fonksiyonu, İteratif Olarak Tekrar Ağırlıklandırılan En Küçük Kareler Yöntemi, M- Estimation Method, Robust Regression, Pearson Type VI Distribution, Influence Function, Iteratively Re- Weighted Least Squares Method
  7. Yıl: 2020
  8. Dil: Türkçe
  9. Üniversite: Dokuz Eylül Üniversitesi
  10. Enstitü: Sosyal Bilimler Enstitüsü
  11. Ana Bilim Dalı: Ekonometri Ana Bilim Dalı
  12. Bilim Dalı: Ekonometri Bilim Dalı
  13. Sayfa Sayısı: 122

Özet

Birçok regresyon uygulamasında, hataların dağılışı normal olarak varsayılmakta ve parametre tahmini yapılırken En Küçük Kareler (EKK) tahminleme yöntemi kullanılmaktadır. Ancak pratikte hataların dağılışı normal olarak varsayılsa bile, veri seti çözümlendikten sonra elde edilen artıklar genellikle normal dağılış göstermezler. Eğer veri seti içerisinde uzak gözlem(ler) (sapan) veya sapan olduğundan şüphelenilen gözlem(ler) varsa, normallik varsayımı bozulabilir ve EKK ile yapılan parametre tahminleri sapmalı olabilir. Birçok istatistikçi böyle problemler ortaya çıktığında parametre tahminleri için dayanıklı (robust) yöntemlere başvurmuşlardır. Bu yöntemlerin başında En Çok Olabilirlik (EÇO) Tahminleme yönteminin genelleştirilmiş bir versiyonu olan M- Tahminleme Yöntemi gelmektedir. Ancak geleneksel M- Tahminleyiciler eğer veri seti çarpık ve normalden daha fazla basıklık değerine sahipse iyi bir çözüm elde edememektedir. Bu tez çalışmasında Pearson Diferansiyel Denklemi ile Etki Fonksiyonu (IF) arasındaki ilişki kullanılarak Pearson Tip VI (PVI) dağılışına uyum gösteren veri setleri için M- Tahminleme yöntemi önerilmiştir. Bu yöntemin avantajı, geleneksel M- Tahminleyiciler veri setinin çarpıklık ve basıklık değerlerini dikkate almazken Pearson Diferansiyel Denkleminin bu değerleri dikkate alarak farklı çarpıklık ve basıklık değerleri için dinamik çözümler üretmesini sağlamaktır. PVI dağılışının Olasılık Yoğunluk Fonksiyonu (oyf) kullanılarak Amaç, Etki ve Ağırlık fonksiyonları elde edilmiştir. Ayrıca PVI dağılışının kuyruk özellikleri incelenerek simülasyon çalışmalarındaki davranışı gözlemlenmiştir. Regresyon parametrelerinin tahminini yapabilmek için Ağırlık Fonksiyonu kullanılarak İteratif Olarak Tekrar Ağırlıklandırılan En Küçük Kareler Tahminleme Yöntemi (IRWLS) kullanılmıştır. Farklı senaryolara sahip simülasyon çalışmaları ve gerçek veri setleri kullanılarak önerilen yöntemin performansı Toplam Mutlak Sapma (TMS) ve Ortalama Karesel Hata (OKH) kriterleri açısından diğer M- Tahminleyiciler ile karşılaştırılmıştır.

Özet (Çeviri)

In many regression applications, the distribution of the error is assumed to be normal and Least Squares (LS) method is used for parameter estimation. However, in practice, even if the distribution of errors is assumed to be normal, residuals are not generally normally distributed. If the data contains outlier (s) or there are observations (s) which suspected to be outlier, the assumption of normality is violated and parameter estimates which made by using the OLS, will biased. Many statisticians used robust methods for parameter estimates when such problems occur. One of these methods is the M-Estimation Method, a generalized version of the Maximum Likelihood (ML) Estimation method. However, traditional M-Estimators can not achieve a good solution if the data set has skewness and excess kurtosis. In this thesis, using the relationship between Pearson Differential Equation and Influence Function (IF), M-Estimation method is proposed for datasets that are follow Pearson Type VI (PVI) distribution. The advantage of this method is that, while the traditional M-Estimators do not take into account the skewness and kurtosis values of the data set, the Pearson Differential Equation takes into account these values and generate dynamic solutions for different skewness and kurtosis values. Objective, Influence and Weight functions are obtained by using the Probability Density Function (PDF) of the PVI distribution. In addition, the tail properties of PVI distribution are examined and its behavior in simulation studies is observed. By using the Weight Function, the Iteratively Re- Weighted Least Squares Estimation Method (IRWLS) is used to estimate regression parameters. The performance of the proposed method is compared with other M-Estimators in terms of Total Absolute Deviation (TAB) and Mean Square Error (MSE) criteria by using simulation studies with different scenarios and real data sets.

Benzer Tezler

  1. Aykırı değer tespit yöntemlerinin karşılaştırılması: Türkiye dış ticaret verileri üzerine bir uygulama

    A comparison of the outlier detecting methods: An application on Turkish foreign trade data

    AYLİN KOLBAŞI

    Doktora

    Türkçe

    Türkçe

    2018

    EkonometriGazi Üniversitesi

    Ekonometri Ana Bilim Dalı

    PROF. DR. AYDIN ÜNSAL

  2. Essays on infinite variance stable errors and robust estimation procedures

    Sonsuz varyans stable hataları ve sağlam tahmin prosedürleri üzerine makaleler

    FATMA ÖZGÜ SERTTAŞ

    Doktora

    İngilizce

    İngilizce

    2010

    EkonomiIowa State University

    Ekonomi Ana Bilim Dalı

    PROF. DR. BARRY L. FALK

  3. Elektrik pano yangınlarına karşı nesnelerin interneti destekli algılama sisteminin geliştirilmesi

    Development of an internet of things supported detection system against electric panel fires

    MUHAMMED FATİH PEKŞEN

    Doktora

    Türkçe

    Türkçe

    2024

    Mühendislik BilimleriSakarya Üniversitesi

    Yangın ve Yangın Güvenliği Anabilim Dalı

    PROF. DR. YILMAZ UYAROĞLU

  4. Machine learning assisted force field development for nucleic acids

    Nükleik asitler için makine öğrenimi destekli kuvvet alanı geliştirilmesi

    GÖZDE İNİŞ DEMİR

    Doktora

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Hesaplamalı Bilimler ve Mühendislik Ana Bilim Dalı

    PROF. DR. ADEM TEKİN

  5. Application of robust statistics on a crude distillation unit

    Ham petrol destilasyon ünitesinde sağlam istatistiklerin uygulanması

    SİNEM NALBANT KURŞUN

    Yüksek Lisans

    İngilizce

    İngilizce

    2017

    Kimya MühendisliğiBoğaziçi Üniversitesi

    Kimya Mühendisliği Ana Bilim Dalı

    DOÇ. DR. BURAK ALAKENT