İstatistikte aykırı değer tespit yöntemleri: Ekonomik özgürlükler verisi üzerine bir uygulama
Outlier detection methods in statistics: An Application on economic freedom data
- Tez No: 902944
- Danışmanlar: PROF. DR. NECATİ ALP ERİLLİ
- Tez Türü: Yüksek Lisans
- Konular: Ekonometri, Econometrics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: Türkçe
- Üniversite: Sivas Cumhuriyet Üniversitesi
- Enstitü: Sosyal Bilimler Enstitüsü
- Ana Bilim Dalı: Ekonometri Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 73
Özet
İstatistikte aykırı değerler, bir veri kümesinde yer alan çok büyük ya da çok küçük oldukları belirlenen değerler olarak tanımlanabilir. Aykırı değerler elde edilen analiz sonuçları üzerinde ciddi bir etki gösterebileceği gibi hiçbir etkiye de sahip olmayabilirler. Bu yüzden bir veri setinde aykırı değerlerin tespit edilmesi istatistiksel bakımdan çok önemlidir. Aykırı değerler hatalı veriler olmamaları halinde araştırmacılara sürecin nasıl düzeltilebileceği konusunda yardımcı olmaktadırlar. Aykırı değerler farklı sebeplerden dolayı ortaya çıkmaktadır. Bu sebeplerden en çok bilinenleri veri setindeki gözlemlerin doğal nedenlerinden kaynaklanarak kontrol edilemez olanlarıdır. Bunun yanı sıra ölçüm için kullanılan ölçüm aracının yetersiz olması veya yapılan yanlış okuma ve kaydetmeden kaynaklanan sebeplerdir. Aykırı değerlerin tespitinin yapılması, belirlenmesi ve değerlendirilmesi durumunda birbirinden farklı tanımlar yapılmakta ve farklı yöntemler kullanılmaktadır. Bu yöntemler tek değişkenli ve çok değişkenli yöntemler olarak sınıflandırılabilir. Tek değişkenli analiz yöntemleri yalnızca tek değişkene ait aykırı değerlerin tespiti üzerinde çalışırken, çok değişkenli analiz yöntemler ise birden fazla değişkeni baz alarak çalışan yöntemlerdir. Çok değişkenli veri setlerinde aykırı değerler birbirinden bağımsız olarak incelenebilmektedir. Bu şekilde incelenen bazı aykırı değerlerin doğru şekilde tespit edilmediği sonucuna ulaşıldığından bu tarz veriler içine çok değişkenli aykırı değer belirleme yöntemlerinin kullanılması önerilmektedir. Ekonomik özgürlük, bireylerin kendi mülklerini ve emeğini kontrol etme hakkına sahip olmaları anlamına gelmektedir. Ekonomik özgürlüklerin ölçülmesi, ülkelerin her yıl ne kadar özgür veya özgürlükten olduklarının araştırılmasına imkan tanımaktadır. Dünya genelinde ekonomik özgürlüğün ölçülmesi konusunda çalışmalar yapan birçok kuruluş bulunmaktadır. Bu kuruluşlar her yıl düzenli aralıklarla yayımladıkları raporlar ile ülkelerin ekonomik özgürlükleri konusunda analiz ve değerlendirmeler yaparak yayınlamaktadırlar. Heritage Foundation ve Fraser Institute, ekonomik özgürlükleri endeksler kullanarak doğrudan ölçüm yapmaktadır. Freedom House ise raporlarında ekonomik özgürlüğü özgürlük endeksinin bir modülü olarak kullanmaktadır. Bu kuruluşlar, bazı temel özellikler ile ulusal bazda ekonomik özgürlük performansını ölçmek amacıyla, dünya genelinde bir ekonomik özgürlük endeksi hazırlayarak dünya ekonomilerini ekonomik özgürlük açısından yıllık olarak sıralamaktadır. Kuruluşların yapmış oldukları bu endeksler sayesinde, ekonomik özgürlüğün farklı modüllerinin ekonomik faaliyet üzerindeki etkilerinin dünya genelinde kolayca incelenmesi sağlanmaktadır. Bu çalışmada bazı tek ve çok değişkenli aykırı değer belirleme yöntemleri, 2 farklı ekonomik özgürlükler verilerine uygulanmış ve sonuçlar değerlendirilmiştir. Analizler sonucu elde edilen tek değişkenli yöntemlerin sonuçlarına göre en çok aykırı değer olarak görülen ülkeler Kuzey Kore, Küba, Sudan, Venezuela ve Zimbabve oldukları belirlenmiştir. Çok değişkenli yöntemlerin sonuçlarına göre de Sudan, Venezuela, Zimbabve, Libya, Mısır, Timor-Leste, Arjantin ve Katar ülkeleri aykırı değer olarak belirlenmiştir
Özet (Çeviri)
In statistics, outliers can be defined as values in a data set that are determined to be too large or too small. Outliers may have a serious effect on the results of the analysis or they may have no effect at all. Therefore, it is statistically very important to detect outliers in a data set. If the outliers are not erroneous data, they help researchers on how the process can be corrected. Outliers arise for different reasons. The most well-known of these reasons are the uncontrollable ones due to the natural causes of the observations in the data set. They are also caused by the inadequacy of the measuring instrument used for the measurement or by incorrect reading and recording. In the case of detecting, identifying and evaluating outliers, different definitions are made and different methods are used. These methods can be classified as univariate and multivariate methods. While univariate analysis methods work only on the detection of outliers belonging to a single variable, multivariate analysis methods are methods that work on the basis of more than one variable. In multivariate data sets, outliers can be analysed independently of each other. Since it is concluded that some outliers analysed in this way are not detected correctly, it is recommended to use multivariate outlier detection methods for such data. Economic freedom means that individuals have the right to control their own property and labour. Measuring economic freedom allows us to investigate how free or unfree countries are each year. There are many organisations around the world working on the measurement of economic freedom. These organisations publish reports on a regular basis every year, analysing and evaluating the economic freedom of countries. Heritage Foundation and Fraser Institute directly measure economic freedom by using indices. Freedom House, on the other hand, uses economic freedom as a module of the freedom index in its reports. In order to measure economic freedom performance on a national basis with some basic characteristics, these organisations prepare a worldwide economic freedom index and rank the world economies in terms of economic freedom annually. Thanks to these indices, the effects of different modules of economic freedom on economic activity can be easily analysed worldwide. In this study, some univariate and multivariate outlier identification methods are applied to 2 different economic freedom data and the results are evaluated. According to the results of the univariate methods obtained as a result of the analyses, North Korea, Cuba, Sudan, Venezuela and Zimbabwe were found to be the countries with the highest number of outliers. According to the results of multivariate methods, Sudan, Venezuela, Zimbabwe, Libya, Egypt, Timor-Leste, Argentina and Qatar countries were determined as outliers.
Benzer Tezler
- Kentsel sit niteliklerinin mekansal istatistik yöntemleriyle tanımlanması
Definition of urban conservation site features by spatial statistical methods
ZEYNEP ÖZDEMİR
Doktora
Türkçe
2021
Şehircilik ve Bölge Planlamaİstanbul Teknik ÜniversitesiŞehir ve Bölge Planlama Ana Bilim Dalı
PROF. DR. TURGAY KEREM KORAMAZ
- Liman kimliğinin kruvaziyer turizmi üzerindeki etkileri ve limanlara kimlik kazandırılması
The effects of port identity on cruise tourism and gaining an identity for ports
ŞEYMA BAYAZIT
Doktora
Türkçe
2018
Denizcilikİstanbul Teknik ÜniversitesiDeniz Ulaştırma Mühendisliği Ana Bilim Dalı
DOÇ. DR. LEVENT KIRVAL
- Aykırı değerlerin tespiti için kullanılan dayanıklı uzaklık yöntemlerinin karşılaştırılması
The comparison of robust distance methods for outliers detection
TUBA ÇELEBİ
Yüksek Lisans
Türkçe
2019
İstatistikOndokuz Mayıs Üniversitesiİstatistik Ana Bilim Dalı
DOÇ. DR. PELİN KASAP
- Order statistics based training and scoring algorithms for deep outlier detection
Derin aykırı değer analizi için sıra istatistik esaslı optimizasyon ve puanlama algoritmaları
AHMET ZAHİD BALCIOĞLU
Yüksek Lisans
İngilizce
2022
İstatistikYıldız Teknik Üniversitesiİstatistik Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ERHAN ÇENE
- Aykırı değerlerin tespit yöntemleri
Outlier detection methods
MAHMUT ATEŞ
Yüksek Lisans
Türkçe
2022
İstatistikGazi Üniversitesiİstatistik Ana Bilim Dalı
DR. ÖĞR. ÜYESİ JALE BALİBEYOĞLU