Geri Dön

Simetrik ve çarpık dağılımlar için bilgi karmaşıklık (ICOMP) kriteri kullanılarak robust model seçimi

Robust model selection using information complexity (ICOMP) criterion for symmetric and skew distributions

  1. Tez No: 508040
  2. Yazar: YEŞİM GÜNEY
  3. Danışmanlar: PROF. DR. OLÇAY ARSLAN, PROF. DR. HAMPARSUM BOZDOĞAN
  4. Tez Türü: Doktora
  5. Konular: İstatistik, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2018
  8. Dil: Türkçe
  9. Üniversite: Ankara Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 162

Özet

Gelişen teknoloji sayesinde bir istatistiksel problemin çözümü için daha karmaşık modeller ortaya çıkmaktadır. Bu durum alternatif model sayısında artışa neden olmuştur. Bu modellerden hangisinin veriye en uygun, en basit model olduğunu belirlemek için bir çok seçim kriteri tanımlanmıştır. Dağılım varsayımının sağlanmaması, verinin aykırı değer içermesi gibi durumlardan klasik parametre tahmin yöntemleri etkilendiği için, bu tahmin yöntemlerine dayalı model seçim kriterleri de etkilenmektedir. Bu tür problemlerle karşılaşıldığında güvenilir sonuçlar elde etmek için robust model seçim kriterlerine ihtiyaç duyulmaktadır. Yaygın kullanılan kriterlerin robust formları ile ilgili zengin literatür olmasına rağmen, ICOMP kriterinin robust formlarına ilişkin literatürde az sayıda çalışma vardır. Bu tezde farklı birtakım robust istatistiksel yöntemlere dayalı robust ICOMP kriterleri tanımlanmıştır. Çoklu doğrusal regresyon modelinde hataların kalın kuyruklu ve/veya çarpık olması durumları için Student t, çarpık normal ve çarpık t dağılım varsayımları altında model karmaşıklığı hesaplanarak ICOMP bilgi kriterinin bu dağılım varsayımları için formları elde edilmiştir. Bu tezde çoklu doğrusal regresyon modelinde M, S ve MM tahmin edicilerine dayalı robust ICOMP kriterleri önerilmiştir. Çoklu doğrusal regresyonda karşılaşılan bir diğer problem olan çoklu iç ilişkinin model seçimi üzerine etkilerinin azaltılması için ICOMP bilgi kriterinin robust ridge tahmin edicilerine dayalı bir başka robust formu tanımlanmıştır. Karmaşık verilerin modellenmesinde kullanılan ortak konum-ölçek ve konum-ölçek-çarpıklık modellerinde ICOMP kriterinin formları elde edilmiştir. Önerilen kriterlerin, AIC ve ICOMP kriterleri ile performansları simülasyon çalışmaları ve gerçek veri örnekleri ile karşılaştırılmıştır.

Özet (Çeviri)

Because of the developing technology, more complicated models can appear for solving a statistical problem. This situation has led to an increase in the number of alternative models. Many criteria have been defined in the literature to determine which of these models is the simplest model that fits the data well. The model selection criteria based on classical parameter estimation methods are also affected, since these methods are influenced by situations such as deviation from distributional assumptions and the fact that the data contain outliers. When such problems are encountered, robust model selection criteria are needed to obtain reliable results. Despite the rich literature on robust forms of commonly used criteria, there are few studies in the literature on robust forms of the ICOMP criterion. In this thesis, robust ICOMP criteria based on different robust statistical methods are defined. For multiple regression models, the model complexity is calculated under the Student t, skew normal and skew t distribution assumptions for cases where the errors are thick-tailed and / or skewed and the ICOMP information criterion is formulated for these distributional assumptions. In this thesis, a robust ICOMP criterion based on M, S and MM estimators is proposed in a multiple linear regression model. Another robust form based on the robust ridge estimators of the ICOMP information criterion has been defined to reduce the effects of multicollinearity on model selection, another problem encountered in multiple linear regression. The forms of the ICOMP criterion have been obtained in the joint location-scale and location-scale-skewness models used in the modeling of complex data. The performances of the proposed criteria, AIC and ICOMP are compared with the simulation studies and real data examples.

Benzer Tezler

  1. Fake news classification using machine learning and deep learning approaches

    Makine öğrenimi ve derin öğrenme yaklaşımlarını kullanarak sahte haber sınıflandırması

    SAJA ABDULHALEEM MAHMOOD AL-OBAIDI

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ TUBA ÇAĞLIKANTAR

  2. Unit root problems in time series analysis

    Zaman serisi analizlerinde birim kök

    VİLDA PURUTCUOĞLU

    Yüksek Lisans

    İngilizce

    İngilizce

    2004

    İstatistikOrta Doğu Teknik Üniversitesi

    İstatistik Ana Bilim Dalı

    PROF. DR. MOTİ LAL TİKU

  3. Sıra istatistiklerinin bağımlılık yapısının kapulalar ile incelenmesi

    Investigation of dependence structure of the order statistics by copulas

    FERHAN BAŞ KAMAN

    Doktora

    Türkçe

    Türkçe

    2018

    İstatistikGazi Üniversitesi

    İstatistik Ana Bilim Dalı

    DOÇ. DR. HÜLYA OLMUŞ

  4. Anova modellerinde çarpık dağılımlar kullanılarak dayanıklı istatistiksel sonuç çıkarımı ve uygulamaları

    Robust statistical inference in Anova models using skew distributions and aplications

    NURİ ÇELİK

    Doktora

    Türkçe

    Türkçe

    2012

    İstatistikAnkara Üniversitesi

    İstatistik Ana Bilim Dalı

    PROF. DR. BİRDAL ŞENOĞLU

    PROF. DR. OLCAY ARSLAN

  5. EWMA control charts for skewed distributions

    Çarpık dağılımları için EWMA kontrol kartları

    MOUSTAPHA AMINOU TUKUR

    Yüksek Lisans

    İngilizce

    İngilizce

    2020

    İstatistikHacettepe Üniversitesi

    İstatistik Ana Bilim Dalı

    DOÇ. DR. DERYA KARAGÖZ