Çok değişkenli veride aykırı gözlemlerin tespiti için en küçük kovaryans determinantına dayalı test istatistiğinin 1. tip hata bakımından sağlamlığının irdelenmesi
Investigation of the robustness in terms of type i error based on minimum covariance determinant for identify outliers in multivariate data
- Tez No: 342830
- Danışmanlar: YRD. DOÇ. DR. UFUK EKİZ
- Tez Türü: Yüksek Lisans
- Konular: İstatistik, Statistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2013
- Dil: Türkçe
- Üniversite: Gazi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: İstatistik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 50
Özet
Çok değişkenli veri analizinde aykırı gözlemleri tespit etmek, özellikle veri çapı arttığında oldukça zordur. Ayrıca aykırı gözlemler, klasik konum ve dağılış parametre tahminlerini ve dolayısı ile aykırı gözlemleri belirlemekte kullanılan Mahalanobis uzaklık ölçüsünü de etkilemektedir. Bu nedenle Mahalanobis uzaklık ölçüsünde aykırı gözlemlere karşı sağlam tahmin ediciler kullanılması daha uygun görülmektedir. Çok değişkenli verinin konum ve dağılış parametrelerinin En Küçük Kovaryans Determinantı tahmin edicileri, literatürde yer alan aykırı gözlemlere karşı sağlam tahmin edicilerden sadece biridir. Bu çalışmanın amacı, En Küçük Kovaryans Determinantı tahminlerine dayalı sağlam Mahalanobis uzaklıklarının dağılımına ilişkin yaygın olarak kullanılan ki-kare dağılımının aksine, aykırı gözlemlere karşılık gelen uç Mahalanobis uzaklıklar için F dağılımının daha uygun olduğu yönündeki çalışmaların sonuçlarını, simülasyon yolu ile irdelemektir. Bu çalışmada öncelikle aykırı değer ve sağlam istatistik kavramları üzerinde durulmuş, daha sonra En Küçük Kovaryans Determinantı yönteminden bahsedilmiştir. En Küçük Kovaryans Determinantı yönteminin hesaplama zorluğundan dolayı, Hızlı-En Küçük Kovaryans Determinantı yönteminin algoritmasından bahsedilmiş ve simülasyon çalışması bu algoritma üzerinden gerçekleştirilmiştir. Simülasyon çalışmasında ki-kare ve F dağılımları üzerinden yanlış belirleme oranları karşılaştırılmış ve sonuçlar görsel olarak desteklenmiştir. Sonuç olarak, çok değişkenli veride MCD tahminlerine dayalı sağlam Mahalanobis uzaklıkları üzerinden aykırı gözlem tespit etmede yaygın olarak kullanılan ki-kare kritik değerinin aksine, F dağılımına ilişkin kritik değerin kullanılmasının uygun olacağı düşünülmektedir.
Özet (Çeviri)
Outlier identifying in multivariate data analyze is rather hard especially when data size increases. Furthermore, outliers effect the classical location and shape parameter estimators and also Mahalanobis distances which use for outlier detection. Because of that in Mahalanobis distance gauge it would be seen more appropriate to use robust estimators against outliers. Minimum Covariance Determinant is just one of the robust estimator of location and shape estimator of multivariate data which suggested for show the robustness against outliers in literature. The aim of this study with simulation is to probe that based on Minimum Covariance Determinant estimators, contrary to commonly used chi-square distrubition for distances which based on distrubition of robust Mahalanobis distances, F distrubition is more appropriate for outliers. In this study, outlier and robust statistics for against outliers concepts are emphasised primarily and then Minimum Covariance Determinant method is mentioned. Due to the calculation hardness of the Minimum Covariance Determinant, the algorithm of Fast¬-Minimum Covariance Determinant is mentioned, and the simulation study is performed through this algorithm. In simulation study, through chi-square and F distrubition determine the rates of incorrect are compared and results are supported visually. As a result, contrary to commonly used based on MCD estimates via Mahalanobis distance, chi-square distrubition cutt-off for identfying outliers in multivariate data, F distrubition cut-off is considered appropriate to use.
Benzer Tezler
- Minimum kovaryans determinantına dayalı sağlam diskriminant analizi
Robust discriminant analysis based on minimum covariance determinant
SERCAN SEZER
Yüksek Lisans
Türkçe
2019
İstatistikGazi Üniversitesiİstatistik Ana Bilim Dalı
DOÇ. DR. NECLA GÜNDÜZ TEKİN
- Çoklu doğrusal regresyon analizinde çakı tahmin yöntemi ve test problemlerine katkılar
Contributions to the jackknife estimation and test problems in multiple linear regression analysis
TOLGA ZAMAN
- Genetik algoritmaya dayalı yeni bir sağlam korelasyon katsayısı
A new robust correlation coefficient based on the genetic algorithm
KEZİBAN KILIÇ TOPAL
Yüksek Lisans
Türkçe
2015
İstatistikOndokuz Mayıs Üniversitesiİstatistik Ana Bilim Dalı
DOÇ. DR. VEDİDE REZAN USLU
- Denizli Havzası'nın Doğu'sundaki traverten litofasiyeslerin sedimantolojisi, diyajenezi ve petrofiziksel özellikleri (GB, Türkiye)
Sedimentological, diagenetical and petrophysical characterization of travertine lithofacies in the east of Denizli basin (SW Turkey)
CİHAN ARATMAN
Doktora
İngilizce
2023
Petrol ve Doğal Gaz MühendisliğiPamukkale ÜniversitesiJeoloji Mühendisliği Ana Bilim Dalı
PROF. DR. MEHMET ÖZKUL
- Çok değişkenli veride aykırı değerlerin tespiti için MVV yöntemi ve diğer yöntemlerle karşılaştırılması
The MVV method for detecting outliers in multivariate data and a comparison with the other methods
KÜBRA TURGUT