Geri Dön

Kayıp veri durumunda sağlam kestirim

Robust estimation in case of missing data

  1. Tez No: 321449
  2. Yazar: ONUR TOKA
  3. Danışmanlar: DOÇ. DR. MERAL ÇETİN
  4. Tez Türü: Yüksek Lisans
  5. Konular: İstatistik, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2012
  8. Dil: Türkçe
  9. Üniversite: Hacettepe Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 103

Özet

Bu çalışmadaki amaç, hem aykırı değer hem de kayıp veri bulunduran veri kümesinin kayıp değerlerine ve parametre kestirimlerine aykırı değerlerden en az etkilenecek şekilde ulaşabilmektir.Çalışmada kayıp veri ile ilgili tanımlamalar, kayıp veri yükleme yöntemleri ve kayıp verinin tarihsel gelişimi ile ilgili bilgiler verilmiştir. Sağlam istatistik ve sağlam kestirim ile ilgili bilgiler verilerek çalışmada kullanılan sağlam kestirimler açıklanmıştır. Kayıp veri durumunda sağlam kestirim için yapılan çalışmalar aktarılmıştır.Uygulamada iki veri kümesi ele alınmıştır. İlk örnekte belli oranda bozuluma sahip veri kümelerinin rasgele olacak şekilde silinmiş kayıp değerleri klasik ve sağlam yöntemlerle elde edilmiştir. Kayıp değerleri yüklenen veri kümesinin ortalama vektörü ve kovaryans matris kestirimleri için sağlam yöntemlerle çözümleme yapılmıştır. İkinci uygulamada ise regresyon veri kümesinden rasgele şekilde silinmiş kayıp değerler için klasik ve sağlam veri yükleme (imputasyon) yöntemleri kullanılarak kayıp veri kestirimleri karşılaştırılmıştır.Sonuç olarak, veri kümesinin dağılımında bozulumların olması, aykırı değerlerin bulunması kayıp değerlerin ve parametrelerin kestirimlerinde sorun yarattığı görülmüştür. Bu sorunu çözmek için sağlam yöntemler kullanılan kayıp veri yükleme yöntemlerin kullanılmasının daha etkin sonuçlar getirdiği gösterilmiştir.

Özet (Çeviri)

The aim of this study is to find missing values and parameter estimations, which both have been least-influenced by outliers when the data sets have missing values and outliers at the same time. In this study, definitions and historical developments of missing data and missing data imputation methods have been explained. Robust approach and robust estimators have been introduced briefly and then robust estimators which are utilized in this study have been explained. The most significant papers in the literature about robust estimators, missing data imputation methods and parameter estimations in the case of missing data and outliers have been given.For the application, two data sets have been debated. In the first example, randomly removed missing values from contaminated data sets have been obtained by employing classical and robust methods. After imputating the missing parts of the data sets, mean vectors and covariance matrices of these sets have been estimated by using robust methods. For the second example, estimations of randomly removed missing values from contaminated regression data sets, have been obtained by using classical and robust imputation methods and thus, these missing value estimations have been compared.In conclusion, it has been shown that contaminations or the existence of the outliers in the data sets affects the reliability of the estimation of missing values and parameters. It has been shown that robust imputations methods give more consistent results than classical ones.

Benzer Tezler

  1. Bilgilendirici küme boyutuna sahip kümelenmiş verilerin marjinal modellemesi için yeni bir yaklaşım

    A new approach for marginal modelling of the clustered data with informative cluster size

    BETÜL DAĞOĞLU HARK

    Doktora

    Türkçe

    Türkçe

    2020

    BiyoistatistikÇukurova Üniversitesi

    Biyoistatistik Ana Bilim Dalı

    PROF. DR. ZELİHA NAZAN ALPARSLAN

  2. Airplane detection and identification based on mask region convolution neural network

    Üzerine göre uçak tespit ve tip tanimlama mask region convolution neural network

    WALEED AL-SHAIBANI

    Yüksek Lisans

    İngilizce

    İngilizce

    2020

    İletişim Bilimleriİstanbul Teknik Üniversitesi

    İletişim Sistemleri Ana Bilim Dalı

    DR. MUSTAFA HELVACI

  3. Effect of lignin, extractive matter, holocellulose, and alpha cellulose of biomass on calorific value

    Biyokütlenin içeriğindeki lignin, ekstraktif madde, holoselüloz ve alfa selülozun kalorifik değer üzerindeki etkisi

    ÖZLEM ECEM KAYNAR

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Kimya Mühendisliğiİstanbul Teknik Üniversitesi

    Kimya Mühendisliği Ana Bilim Dalı

    PROF. DR. SERDAR YAMAN

  4. Hücresel aykırı gözlem olması durumunda sağlam tahmin yöntemleri ile istatistiksel veri analizi

    Statistical data analysis with robust estimation methods in cellwise outlier observation

    ELİF ŞEN

    Doktora

    Türkçe

    Türkçe

    2023

    İstatistikAnkara Üniversitesi

    İstatistik Ana Bilim Dalı

    PROF. DR. OLÇAY ARSLAN

  5. Basel ıı sürecinde Kobi'lerin kredi risklerinin ölçülmesi

    Measuring credit risks of Smes in the process of basel II

    BAŞAK KIRMIZITAŞ

    Yüksek Lisans

    Türkçe

    Türkçe

    2007

    İşletmeHacettepe Üniversitesi

    İşletme Ana Bilim Dalı

    PROF. DR. MEHMET BAHA KARAN