Geri Dön

Çok değişkenli veride aykırı değerlerin tespiti için MVV yöntemi ve diğer yöntemlerle karşılaştırılması

The MVV method for detecting outliers in multivariate data and a comparison with the other methods

  1. Tez No: 269747
  2. Yazar: KÜBRA TURGUT
  3. Danışmanlar: YRD. DOÇ. DR. UFUK EKİZ
  4. Tez Türü: Yüksek Lisans
  5. Konular: İstatistik, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2010
  8. Dil: Türkçe
  9. Üniversite: Gazi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik Bölümü
  12. Bilim Dalı: İstatistik Ana Bilim Dalı
  13. Sayfa Sayısı: 66

Özet

Çok değişkenli veri setlerinde aykırı değerleri tespit etmek özellikle değişken sayısı ikiyi geçtiğinde zor olabilmektedir. Bu nedenle konum ve kovaryans matrisinin sağlam tahminine dayanan çeşitli yöntemler önerilmiştir. Bu yöntemler etkili olmalarına rağmen geniş ve büyük boyutlu veri setleri için kullanışsızdırlar. Bu yöntemlerin hesaplama karmaşıklığı veri setlerinin boyutu arttığı zaman artmaktadır.Bu çalışmanın amacı, çok değişkenli veride çoklu aykırı değerlerin belirlenmesinde kullanılan En Küçük Hacimli Elipsoid, En Küçük Kovaryans Determinantı ve Hızlı En Küçük Kovaryans Determinantı gibi yöntemlere alternatif olarak geliştirilen En Küçük Vektör Varyansı yöntemini tanıtmaktır.Bu tezde öncelikle aykırı değer(outlier) ve bozulma noktası(breakdown point) kavramları ele alınmış, daha sonra yukarıda bahsedilen yöntemler tanıtılmış ve son olarak bir simülasyon çalışması ile En Küçük Vektör Varyansı ve diğer yöntemlerin aykırı değer belirleme oranı ve yöntemlerin hesaplama hızı bakımından karşılaştırması yapılmıştır.Sonuçta, En Küçük Vektör Varyansı yönteminin geniş ve büyük boyutlu veri setlerine uygulanabilir olduğu görülmüştür ve bu algoritmanın hesaplama karmaşıklığı önemli derecede diğer yöntemlerden azdır.

Özet (Çeviri)

Outliers in multivariate data sets can be hard to detect especially when the number of variables exceeds two. Therefore, various methods have been suggested that based on robust estimation of location and covariance matrix. Although these methods are influential, they are cumbersome for large and high dimension data sets. Computational complexity of these methods increases when the dimension of the data sets is getting increases.The aim of this study is to present the Minimum Vector Variance method which is developed as an alternative to the methods like Minimum Volume Ellipsoid, Minimum Covariance Determinant and Fast Minimum Covariance Determinant that are used in identifying multiple outliers in multivariate data.In this thesis, firstly outlier and breakdown point concepts have been given, secondly the above mentioned methods have beeen introduced and finally the Minimum Vector Variance method and other methods have been compared with a simulation study with respect to the ratio of outlier detection and the computation speed of the methods.As a result, it has been found that the Minimum Vector Variance method is applicable to large and high dimension data sets and the computational complexity of this algorithm is significantly smaller than that of other methods.

Benzer Tezler

  1. Dairesel veri analizinin teorik temelleri ve bir uygulaması

    Theoretical fundamentals and an application of circular data analysis

    YILDIRIM DEMİR

    Doktora

    Türkçe

    Türkçe

    2016

    İstatistikAtatürk Üniversitesi

    Zootekni Ana Bilim Dalı

    PROF. DR. ÖMER CEVDET BİLGİN

  2. Çoklu doğrusal regresyon analizinde çakı tahmin yöntemi ve test problemlerine katkılar

    Contributions to the jackknife estimation and test problems in multiple linear regression analysis

    TOLGA ZAMAN

    Doktora

    Türkçe

    Türkçe

    2017

    İstatistikOndokuz Mayıs Üniversitesi

    İstatistik Ana Bilim Dalı

    DOÇ. DR. KAMİL ALAKUŞ

  3. Effect of lignin, extractive matter, holocellulose, and alpha cellulose of biomass on calorific value

    Biyokütlenin içeriğindeki lignin, ekstraktif madde, holoselüloz ve alfa selülozun kalorifik değer üzerindeki etkisi

    ÖZLEM ECEM KAYNAR

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Kimya Mühendisliğiİstanbul Teknik Üniversitesi

    Kimya Mühendisliği Ana Bilim Dalı

    PROF. DR. SERDAR YAMAN

  4. Proposal for a forecasting methodology to predict commercial real estate values in Istanbul using social big data

    Sosyal büyük veri kullanımı ile İstanbul'daki ticari gayrimenkul değerlerini tahmin etmek için bir kestirim yöntemi önerisi

    MARAL TAŞCILAR

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Ekonometriİstanbul Teknik Üniversitesi

    Gayrimenkul Geliştirme Ana Bilim Dalı

    DOÇ. KEREM YAVUZ ARSLANLI

  5. Denizli Havzası'nın Doğu'sundaki traverten litofasiyeslerin sedimantolojisi, diyajenezi ve petrofiziksel özellikleri (GB, Türkiye)

    Sedimentological, diagenetical and petrophysical characterization of travertine lithofacies in the east of Denizli basin (SW Turkey)

    CİHAN ARATMAN

    Doktora

    İngilizce

    İngilizce

    2023

    Petrol ve Doğal Gaz MühendisliğiPamukkale Üniversitesi

    Jeoloji Mühendisliği Ana Bilim Dalı

    PROF. DR. MEHMET ÖZKUL