Çok değişkenli veride aykırı değerlerin tespiti için MVV yöntemi ve diğer yöntemlerle karşılaştırılması
The MVV method for detecting outliers in multivariate data and a comparison with the other methods
- Tez No: 269747
- Danışmanlar: YRD. DOÇ. DR. UFUK EKİZ
- Tez Türü: Yüksek Lisans
- Konular: İstatistik, Statistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2010
- Dil: Türkçe
- Üniversite: Gazi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: İstatistik Bölümü
- Bilim Dalı: İstatistik Ana Bilim Dalı
- Sayfa Sayısı: 66
Özet
Çok değişkenli veri setlerinde aykırı değerleri tespit etmek özellikle değişken sayısı ikiyi geçtiğinde zor olabilmektedir. Bu nedenle konum ve kovaryans matrisinin sağlam tahminine dayanan çeşitli yöntemler önerilmiştir. Bu yöntemler etkili olmalarına rağmen geniş ve büyük boyutlu veri setleri için kullanışsızdırlar. Bu yöntemlerin hesaplama karmaşıklığı veri setlerinin boyutu arttığı zaman artmaktadır.Bu çalışmanın amacı, çok değişkenli veride çoklu aykırı değerlerin belirlenmesinde kullanılan En Küçük Hacimli Elipsoid, En Küçük Kovaryans Determinantı ve Hızlı En Küçük Kovaryans Determinantı gibi yöntemlere alternatif olarak geliştirilen En Küçük Vektör Varyansı yöntemini tanıtmaktır.Bu tezde öncelikle aykırı değer(outlier) ve bozulma noktası(breakdown point) kavramları ele alınmış, daha sonra yukarıda bahsedilen yöntemler tanıtılmış ve son olarak bir simülasyon çalışması ile En Küçük Vektör Varyansı ve diğer yöntemlerin aykırı değer belirleme oranı ve yöntemlerin hesaplama hızı bakımından karşılaştırması yapılmıştır.Sonuçta, En Küçük Vektör Varyansı yönteminin geniş ve büyük boyutlu veri setlerine uygulanabilir olduğu görülmüştür ve bu algoritmanın hesaplama karmaşıklığı önemli derecede diğer yöntemlerden azdır.
Özet (Çeviri)
Outliers in multivariate data sets can be hard to detect especially when the number of variables exceeds two. Therefore, various methods have been suggested that based on robust estimation of location and covariance matrix. Although these methods are influential, they are cumbersome for large and high dimension data sets. Computational complexity of these methods increases when the dimension of the data sets is getting increases.The aim of this study is to present the Minimum Vector Variance method which is developed as an alternative to the methods like Minimum Volume Ellipsoid, Minimum Covariance Determinant and Fast Minimum Covariance Determinant that are used in identifying multiple outliers in multivariate data.In this thesis, firstly outlier and breakdown point concepts have been given, secondly the above mentioned methods have beeen introduced and finally the Minimum Vector Variance method and other methods have been compared with a simulation study with respect to the ratio of outlier detection and the computation speed of the methods.As a result, it has been found that the Minimum Vector Variance method is applicable to large and high dimension data sets and the computational complexity of this algorithm is significantly smaller than that of other methods.
Benzer Tezler
- Dairesel veri analizinin teorik temelleri ve bir uygulaması
Theoretical fundamentals and an application of circular data analysis
YILDIRIM DEMİR
- Çoklu doğrusal regresyon analizinde çakı tahmin yöntemi ve test problemlerine katkılar
Contributions to the jackknife estimation and test problems in multiple linear regression analysis
TOLGA ZAMAN
- Effect of lignin, extractive matter, holocellulose, and alpha cellulose of biomass on calorific value
Biyokütlenin içeriğindeki lignin, ekstraktif madde, holoselüloz ve alfa selülozun kalorifik değer üzerindeki etkisi
ÖZLEM ECEM KAYNAR
Yüksek Lisans
İngilizce
2022
Kimya Mühendisliğiİstanbul Teknik ÜniversitesiKimya Mühendisliği Ana Bilim Dalı
PROF. DR. SERDAR YAMAN
- Proposal for a forecasting methodology to predict commercial real estate values in Istanbul using social big data
Sosyal büyük veri kullanımı ile İstanbul'daki ticari gayrimenkul değerlerini tahmin etmek için bir kestirim yöntemi önerisi
MARAL TAŞCILAR
Yüksek Lisans
İngilizce
2023
Ekonometriİstanbul Teknik ÜniversitesiGayrimenkul Geliştirme Ana Bilim Dalı
DOÇ. KEREM YAVUZ ARSLANLI
- Denizli Havzası'nın Doğu'sundaki traverten litofasiyeslerin sedimantolojisi, diyajenezi ve petrofiziksel özellikleri (GB, Türkiye)
Sedimentological, diagenetical and petrophysical characterization of travertine lithofacies in the east of Denizli basin (SW Turkey)
CİHAN ARATMAN
Doktora
İngilizce
2023
Petrol ve Doğal Gaz MühendisliğiPamukkale ÜniversitesiJeoloji Mühendisliği Ana Bilim Dalı
PROF. DR. MEHMET ÖZKUL