Geri Dön

Hücresel ve durumsal aykırı değerlerle sağlam regresyon modellerinin karşılaştırılması

Comparison of robust regression methods in the presence of cellwise and casewise outliers

  1. Tez No: 901256
  2. Yazar: GÜVEN PEKDEMİR
  3. Danışmanlar: PROF. DR. ÖZLEM ALPU
  4. Tez Türü: Yüksek Lisans
  5. Konular: İstatistik, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: Türkçe
  9. Üniversite: Eskişehir Osmangazi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: İstatistik Teorisi Bilim Dalı
  13. Sayfa Sayısı: 76

Özet

2000'li yıllara kadar veri analizinin ön işleme adımında, satırların gözlem ve sütunların değişkenler olduğu bir veri matrisinde durum bazlı (satır bazlı, satırsal, durumsal, casewise) aykırı değerler üzerine yoğunlaşılmıştı. 2000'li yılların başından itibaren ise veri matrisindeki her bir hücrenin potansiyel aykırı değer olarak değerlendirildiği ve tüm bir gözlemin dikkate alınmadığı hücresel aykırı değerler gündeme gelmiştir. Bu tip aykırı değerlerin veri kümelerinde durum bazında aykırı değerlerle birlikte ortaya çıkması muhtemeldir. Çok değişkenli veri analizinin temel taşları olan konum ve dağılım matrisinin tahmini ve çıkarım için regresyon katsayılarını tahmin etmek bu noktada büyük önem taşımaktadır. Bu tezde THCM ve ICM modelleri altında hücresel ve durumsal aykırı değerleri tespit ederek çok değişkenli veri setlerinde hücresel ve durumsal aykırı değer olması durumunda kullanılan değer atama (imputasyon) yöntemleri ile bu gözlemlerden daha az etkilenecek sağlam istatistiksel yöntemler birleştirilerek karşılaştırılmıştır. Son dönemlerde veri analizi ile ilgili çalışmalarda ise verilerin kontamine olmamış kısmından azami ölçüde faydalanmak amacıyla, uygulamada aykırı değerlerin durum bazında incelenmesinden ziyade hücre bazında tespit edilmesi tercih edilmektedir. Ayrıca hücresel aykırı değerlerin tespitinden sonra parametre tahmininde yerine koyma yöntemleri ve/veya sağlam tahmin edicilerden faydalanılması için algoritmalar önerilmektedir. Çalışmada öncelikle aykırı değer kavramı ile durumsal ve hücresel aykırı değer türleri ele alınıp, bu aykırı değerlerin oluşma mekanizmaları incelenmiştir. Ardından bu iki tip aykırı değeri teşhis etme yöntemleri ve teşhis sonrası parametre tahmininde kullanılan sağlam tahmin edicilerin regresyon analizindeki performansları Automobile veri seti üzerinde ve simülasyon çalışması ile incelenmiş ve karşılaştırılmıştır.

Özet (Çeviri)

Until the 2000s, the preprocessing stage of data analysis focused on casewise (rowwise) outliers in a data matrix where rows are observations and columns are variables. Since the early 2000s, cellwise outliers have been introduced, where each cell in the data matrix is considered as a potential outlier. Such outliers are likely to appear in datasets together with casewise outliers. Cellwise outliers are relatively likely to occur in datasets along with rowwise outliers. Estimation of the location and dispersion matrix, which are the cornerstones of multivariate data analysis, and estimation of regression coefficients for inference are of great importance at this point. In this paper, imputation methods used in multivariate data sets in the presence of cellwise and row outliers by detecting cellwise and row outliers under THCM and ICM models are compared with robust statistical methods that will be less affected by these observations. In recent studies on data analysis, in order to make maximum use of the uncontaminated part of the data, it is preferred to detect outliers on a cell-by-cell basis rather than on a case-by-case basis. Moreover, algorithms are proposed to utilize substitution methods and/or robust estimators for parameter estimation after cellwise outlier detection. In this study, firstly, the concept of outliers and the types of situational and cellwise outliers are discussed and the mechanisms of these outliers are analyzed. Then, the methods of identifying these two types of outliers and the performances of robust estimators used in parameter estimation after identification in regression analysis are examined and compared on Automobile dataset and simulation study.

Benzer Tezler

  1. Detection of the red blood cell adhesion to the vascular endothelium using microfluidic chip in beta thalassemia patients

    Beta talasemi hastalarında mikroakışkan çip kullanılarak kırmızı kan hücrelerinin vasküler endotele yapışmasının tespiti

    NESLİHAN ÇİLEK

    Doktora

    İngilizce

    İngilizce

    2024

    Moleküler TıpKoç Üniversitesi

    Hücresel ve Moleküler Tıp Ana Bilim Dalı

    PROF. ÖZLEM YALÇIN SEYHAN

  2. Regulation of acquired drug resistance by mirnas in high grade serous ovarian cancer

    Yüksek dereceli seröz over kanserinde ılaç direncinin oluşumunda minaların etkileri

    ELİF MERVE AYDIN

    Doktora

    İngilizce

    İngilizce

    2024

    Moleküler TıpKoç Üniversitesi

    Hücresel ve Moleküler Tıp Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ İREM DURMAZ ŞAHİN

  3. Investigation of n-terminus mll complexes on the reversion of taxane resistance in castration-resistant prostate cancer

    N-terminal mll komplekslerinin kastrasyona dirençli prostat kanserinde taksan direncini geri döndürmedeki rollerinin araştırılması

    İPEK BULUT

    Doktora

    İngilizce

    İngilizce

    2024

    Moleküler TıpKoç Üniversitesi

    Hücresel ve Moleküler Tıp Ana Bilim Dalı

    PROF. DR. CEYDA AÇILAN AYHAN

  4. Staphylococcus aureus enterotoksin B süperantijeninin COVİD-19 ilk aşama gelişiminde bağışıklık sistemi dışındaki kritik genler üzerinde etkisi

    Effect of staphylococcus aureus enterotoxin B superantigen on critical genes outside the immune system in COVİD 19 first stage development

    GİZEM KAZAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    MikrobiyolojiLOKMAN HEKİM ÜNİVERSİTESİ

    Hücresel ve Moleküler Tıp Ana Bilim Dalı

    DOÇ. DR. CAN TÜRK

  5. Targeting ARID1A: Leveraging synthetic lethality as a therapeutic strategy in breast cancer through CRISPR screening

    ARID1A Hedefleme: CRISPR tarama yoluyla meme kanserinde sentetik letaliteyi terapötik bir strateji olarak kullanma

    ELİF GÜZAR

    Yüksek Lisans

    İngilizce

    İngilizce

    2025

    Moleküler TıpKoç Üniversitesi

    Sağlık Bilimleri Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ GÖZDE KORKMAZ