Geri Dön

Çok değişkenli veride aykırı gözlemlerin tespiti için en küçük kovaryans determinantına dayalı test istatistiğinin 1. tip hata bakımından sağlamlığının irdelenmesi

Investigation of the robustness in terms of type i error based on minimum covariance determinant for identify outliers in multivariate data

  1. Tez No: 342830
  2. Yazar: EREN GÜMÜŞ
  3. Danışmanlar: YRD. DOÇ. DR. UFUK EKİZ
  4. Tez Türü: Yüksek Lisans
  5. Konular: İstatistik, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2013
  8. Dil: Türkçe
  9. Üniversite: Gazi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 50

Özet

Çok değişkenli veri analizinde aykırı gözlemleri tespit etmek, özellikle veri çapı arttığında oldukça zordur. Ayrıca aykırı gözlemler, klasik konum ve dağılış parametre tahminlerini ve dolayısı ile aykırı gözlemleri belirlemekte kullanılan Mahalanobis uzaklık ölçüsünü de etkilemektedir. Bu nedenle Mahalanobis uzaklık ölçüsünde aykırı gözlemlere karşı sağlam tahmin ediciler kullanılması daha uygun görülmektedir. Çok değişkenli verinin konum ve dağılış parametrelerinin En Küçük Kovaryans Determinantı tahmin edicileri, literatürde yer alan aykırı gözlemlere karşı sağlam tahmin edicilerden sadece biridir. Bu çalışmanın amacı, En Küçük Kovaryans Determinantı tahminlerine dayalı sağlam Mahalanobis uzaklıklarının dağılımına ilişkin yaygın olarak kullanılan ki-kare dağılımının aksine, aykırı gözlemlere karşılık gelen uç Mahalanobis uzaklıklar için F dağılımının daha uygun olduğu yönündeki çalışmaların sonuçlarını, simülasyon yolu ile irdelemektir. Bu çalışmada öncelikle aykırı değer ve sağlam istatistik kavramları üzerinde durulmuş, daha sonra En Küçük Kovaryans Determinantı yönteminden bahsedilmiştir. En Küçük Kovaryans Determinantı yönteminin hesaplama zorluğundan dolayı, Hızlı-En Küçük Kovaryans Determinantı yönteminin algoritmasından bahsedilmiş ve simülasyon çalışması bu algoritma üzerinden gerçekleştirilmiştir. Simülasyon çalışmasında ki-kare ve F dağılımları üzerinden yanlış belirleme oranları karşılaştırılmış ve sonuçlar görsel olarak desteklenmiştir. Sonuç olarak, çok değişkenli veride MCD tahminlerine dayalı sağlam Mahalanobis uzaklıkları üzerinden aykırı gözlem tespit etmede yaygın olarak kullanılan ki-kare kritik değerinin aksine, F dağılımına ilişkin kritik değerin kullanılmasının uygun olacağı düşünülmektedir.

Özet (Çeviri)

Outlier identifying in multivariate data analyze is rather hard especially when data size increases. Furthermore, outliers effect the classical location and shape parameter estimators and also Mahalanobis distances which use for outlier detection. Because of that in Mahalanobis distance gauge it would be seen more appropriate to use robust estimators against outliers. Minimum Covariance Determinant is just one of the robust estimator of location and shape estimator of multivariate data which suggested for show the robustness against outliers in literature. The aim of this study with simulation is to probe that based on Minimum Covariance Determinant estimators, contrary to commonly used chi-square distrubition for distances which based on distrubition of robust Mahalanobis distances, F distrubition is more appropriate for outliers. In this study, outlier and robust statistics for against outliers concepts are emphasised primarily and then Minimum Covariance Determinant method is mentioned. Due to the calculation hardness of the Minimum Covariance Determinant, the algorithm of Fast¬-Minimum Covariance Determinant is mentioned, and the simulation study is performed through this algorithm. In simulation study, through chi-square and F distrubition determine the rates of incorrect are compared and results are supported visually. As a result, contrary to commonly used based on MCD estimates via Mahalanobis distance, chi-square distrubition cutt-off for identfying outliers in multivariate data, F distrubition cut-off is considered appropriate to use.

Benzer Tezler

  1. Minimum kovaryans determinantına dayalı sağlam diskriminant analizi

    Robust discriminant analysis based on minimum covariance determinant

    SERCAN SEZER

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    İstatistikGazi Üniversitesi

    İstatistik Ana Bilim Dalı

    DOÇ. DR. NECLA GÜNDÜZ TEKİN

  2. Çoklu doğrusal regresyon analizinde çakı tahmin yöntemi ve test problemlerine katkılar

    Contributions to the jackknife estimation and test problems in multiple linear regression analysis

    TOLGA ZAMAN

    Doktora

    Türkçe

    Türkçe

    2017

    İstatistikOndokuz Mayıs Üniversitesi

    İstatistik Ana Bilim Dalı

    DOÇ. DR. KAMİL ALAKUŞ

  3. Genetik algoritmaya dayalı yeni bir sağlam korelasyon katsayısı

    A new robust correlation coefficient based on the genetic algorithm

    KEZİBAN KILIÇ TOPAL

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    İstatistikOndokuz Mayıs Üniversitesi

    İstatistik Ana Bilim Dalı

    DOÇ. DR. VEDİDE REZAN USLU

  4. Denizli Havzası'nın Doğu'sundaki traverten litofasiyeslerin sedimantolojisi, diyajenezi ve petrofiziksel özellikleri (GB, Türkiye)

    Sedimentological, diagenetical and petrophysical characterization of travertine lithofacies in the east of Denizli basin (SW Turkey)

    CİHAN ARATMAN

    Doktora

    İngilizce

    İngilizce

    2023

    Petrol ve Doğal Gaz MühendisliğiPamukkale Üniversitesi

    Jeoloji Mühendisliği Ana Bilim Dalı

    PROF. DR. MEHMET ÖZKUL

  5. Çok değişkenli veride aykırı değerlerin tespiti için MVV yöntemi ve diğer yöntemlerle karşılaştırılması

    The MVV method for detecting outliers in multivariate data and a comparison with the other methods

    KÜBRA TURGUT

    Yüksek Lisans

    Türkçe

    Türkçe

    2010

    İstatistikGazi Üniversitesi

    İstatistik Bölümü

    YRD. DOÇ. DR. UFUK EKİZ