Geri Dön

Simetrik çok değişkenli dağılımlarda aykırı değer belirleme yöntemlerinin performanslarının incelenmesi

Evaluation of outlier detection methods performance in symmetric multivariate distributions

  1. Tez No: 487372
  2. Yazar: ENDER UZABACI
  3. Danışmanlar: PROF. DR. İLKER ERCAN
  4. Tez Türü: Doktora
  5. Konular: Biyoistatistik, Biostatistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2017
  8. Dil: Türkçe
  9. Üniversite: Uludağ Üniversitesi
  10. Enstitü: Sağlık Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Biyoistatistik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 117

Özet

Aykırı değer belirleme yöntemleri, tüm bilimsel çalışmalarda elde edilecek sonuçların güvenilir olması açısından önemli bir temel oluşturmaktadır. Çok değişkenli veri setlerinde aykırı değer belirleme yöntemlerinin kullanımı tek değişkenli duruma göre daha zor ve karışıktır. Bu tez çalışmasının amacı, çok değişkenli veri setlerinde aykırı değer belirleme yöntemlerinden BACON (Blocked Adaptive Computationally Efficient Outlier Nominators) algoritması, Hızlı Minimum Kovaryans Determinantı yöntemi (Fast-MCD) ve Robust Mahalanobis uzaklığı yöntemini incelemektir. Bu amaçla; çok değişkenli normal, çok değişkenli Cauchy ve çok değişkenli Laplace dağılımlarından farklı örneklem büyüklüğü ve değişken sayısına göre veriler türetilerek, aykırı değer belirleme yöntemlerinin performansları karşılaştırılmıştır. Performans değerlendirmesi için ölçüt olarak yanlış negatif ve yanlış pozitif değerler kullanılmıştır. Bu çalışmanın sonucunda, yöntemlerin performansının dağılım tipine göre farklılık gösterdiği tespit edilmiştir. Yanlış negatif ölçütü açısından BACON yönteminin, yanlış pozitif ölçütü açısından Robust Mahalanobis uzaklığı yönteminin diğer yöntemlerden daha iyi performans gösterdiği belirlenmiştir.

Özet (Çeviri)

Outlier detection methods constitute an important basis in terms of obtaining reliable results in all scientific studies. Determining outliers in multivariate data sets is more difficult and complicated than in univariate case. The aim of this thesis is to evaluate BACON (Blocked Adaptive Computationally Efficient Outlier Nominators) algorithm, Fast Minimum Covariance Determinant method (Fast-MCD) and Robust Mahalanobis distance method in multivariate data sets. For this purpose, outlier detection methods were compared by deriving data from multivariate normal, multivariate Laplace and multivariate Cauchy distributions with different sample size and number of variable. False negative and false positive values were used to evaluate performances. As a result of this work, it is determined that performance of methods varies according to distribution type. In terms of false negatives, BACON method and in terms of false positives, Robust Mahalanobis distance method were determined to perform better than the other methods.

Benzer Tezler

  1. Otoregresif hata terimli regresyon modellerinde robust parametre tahmini ve model seçimi

    Robust parameter estimation and model selection in autoregressive error term regression models

    YETKİN TUAÇ

    Doktora

    Türkçe

    Türkçe

    2020

    İstatistikAnkara Üniversitesi

    İstatistik Ana Bilim Dalı

    PROF. DR. OLÇAY ARSLAN

  2. Robust bayesyen regresyon analizi

    Robust bayesian regression analysis

    MUTLU KAYA

    Doktora

    Türkçe

    Türkçe

    2020

    İstatistikAnkara Üniversitesi

    İstatistik Ana Bilim Dalı

    PROF. DR. OLÇAY ARSLAN

  3. Bazı çok değişkenli normallik testlerinin karşılaştırılması

    Comparison of some multivariate normality tests

    DEMET YÜKSEK

    Yüksek Lisans

    Türkçe

    Türkçe

    2013

    İstatistikEskişehir Osmangazi Üniversitesi

    İstatistik Ana Bilim Dalı

    DOÇ. DR. ÖZLEM ALPU

  4. Tek değişkenli ve çok değişkenli bazı normallik testlerinin karşılaştırılması

    Comparison of some univariate and multivariate normality tests

    HALİL İBRAHİM AKÇADAĞ

    Doktora

    Türkçe

    Türkçe

    2013

    BiyoistatistikSelçuk Üniversitesi

    Zootekni Ana Bilim Dalı

    YRD. DOÇ. DR. ABDURRAHMAN TOZLUCA

  5. Pearson korelasyon katsayısının tahmin edicilerinin ve bu tahmin edicilere dayanan test istatistiklerinin karşılaştırılması

    The comparison of the estimators of the pearson correlation coefficient and the test statistics based on these estimators

    AHMET CAN DİKER

    Yüksek Lisans

    Türkçe

    Türkçe

    2009

    İstatistikEge Üniversitesi

    Uygulamalı İstatistik Ana Bilim Dalı

    YRD. DOÇ. DR. HAKAN SAVAŞ SAZAK