Geri Dön

Lojistik regresyonda çoklu aykırı gözlemlerin belirlenmesi ve etkililiklerinin incelenmesi

Detection of multiple outliers in logistic regression and examination of effectiveness

  1. Tez No: 312817
  2. Yazar: MUSTAFA SELÇUK YAVUZKANAT
  3. Danışmanlar: PROF. DR. M. AKİF BAKIR
  4. Tez Türü: Yüksek Lisans
  5. Konular: İstatistik, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2011
  8. Dil: Türkçe
  9. Üniversite: Gazi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 91

Özet

Regresyon, bağımlı değişken ile bir veya daha çok bağımsız değişken arasındaki ilişkiyi incelemek amacıyla kullanılan bir analiz yöntemidir. Regresyon analizinde bağımlı değişken genellikle sürekli ve ölçülebilir alınır. Ancak bazı durumlarda bağımlı değişken kesiklidir ve sadece iki uçlu değerler alabilir. Böyle durumlarda bağımlı değişken Binom olasılık dağılımına sahip olacağından regresyon modelini bir olasılık modeli olarak kurmak gerekir. Bu bağlamda regresyon modeli lojistik dağılım fonksiyonuna dayalı olarak yazılabilir. Doğrusal regresyon modellerinde olduğu gibi, lojistik regresyon modellerinde de veri kümesi uzayının uçlarında yer alan noktalar olabilir. Aykırı gözlem olarak bilinen bu gözlemlerin belirlenmesi ve regresyon fonksiyonunun uyum iyiliği ve/veya parametre tahminleri üzerine etkisi olup olmadığının irdelenmesi gerekir. Aykırı gözlemlerin belirlenmesine yönelik bazı tek gözlem yöntemleri geliştirilmiştir. Uygulamada sıkça rastlanan yaklaşım, aykırı gözlemlerin bu türden yöntemlerle incelenmesidir. Ancak maskeleme (masking) ve sahte aykırı gözlem (swamping) problemi söz konusu olduğunda tek gözlem yöntemleri başarısız olur. Bu nedenle bu problemlerden etkilenmeyecek bir yönteme ihtiyaç duyulmaktadır. Bu çalışmada, lojistik regresyonda çoklu aykırı gözlemlerin belirlenmesinde etkili bir şekilde kullanılabilecek olan Genelleştirilmiş Standart Pearson Artıkları (GSPR) yöntemi Türkiye 2009 Elit Bayan Voleybol ligine ve firma iflaslarına ilişkin verilere uygulanarak yöntemin etkin biçimde çalıştığı ve maskeleme etkisini giderdiği gösterilmiştir.

Özet (Çeviri)

Regression is a method of analysis performed to examine the relationship between a dependent variable and one or more independent variables. In regression analysis, dependent variable is generally held continuous and measurable. But in some cases, dependent variable is binary and it takes only discrete values. Since dependent variable has binominal probability distribution in such cases, regression model should be set up as a probability model. In that sense, regression model can be designed in accordance with logistic distribution function. Like the linear regression models, there may be points at the end of the data set space also in logistic regressions. These observations which are known as outlier observations need to be determined and it should be elaborated whether they have any impact on goodness of fit of the regression functions and/or parameter estimates. Some single observation methods have been developed to identify outliers. The most frequent approach in practice is using such kind of methods to examine the outliers. However, in case of masking and swamping, single observation methods fail. Therefore, a method which will not be affected by these problems is required. In this study, the method of Generalised Standard Pearson Residuals (GSPR) which can be used effectively for identification of multiple outliers in logistic regression has been applied to the data concerning Turkey 2009 Elite Women Volleyball League and firm bankrupties and it has been proved that the method works effectively and eliminates the effect of masking.

Benzer Tezler

  1. Derin öğrenme ve büyük veri analitiği yöntemleriKullanarak Covid-19 yayılımının ileriye dönük tahmini

    Forecasting the spread of covid-19 using deep learning and big data analytics methods

    CYLAS KIGANDA

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgisayar Bilimleri Ana Bilim Dalı

    PROF. DR. MUHAMMET ALİ AKCAYOL

  2. Sınıflandırma yöntemlerinin performansının üretilmiş ve gerçek veri setleri kullanılarak incelenmesi

    Analyzing the performance of classification methods using generated and real datasets

    ÇİĞDEM KADAİFÇİ YANMAZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    İstatistikMimar Sinan Güzel Sanatlar Üniversitesi

    İstatistik Ana Bilim Dalı

    PROF. DR. EYLEM DENİZ HOWE

  3. İkili lojistik regresyonda robust yöntemler

    Robust methods in binary logistics regression

    EBRU GÜNDOĞAN AŞIK

    Doktora

    Türkçe

    Türkçe

    2023

    İstatistikKaradeniz Teknik Üniversitesi

    İstatistik ve Bilgisayar Bilimleri Ana Bilim Dalı

    PROF. DR. ZAFER KÜÇÜK

    PROF. DR. ARZU ALTIN YAVUZ

  4. Lojistik elastik net yönteminin alternatif yöntemlerle karşılaştırılması

    Comparison of the logistic elastic net method with alternative methods

    SEVİM SİMGE UYSAL

    Yüksek Lisans

    Türkçe

    Türkçe

    2020

    İstatistikEskişehir Osmangazi Üniversitesi

    İstatistik Ana Bilim Dalı

    PROF. DR. ARZU ALTIN YAVUZ

  5. Modeling educational data with machine learning methods

    Eğitim verilerinin makine oğrenmesi algoritmaları kullanılarak modellenmesi

    AYŞE İLKNUR DİLEK

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Kültür Üniversitesi

    Matematik ve Bilgisayar Bilimleri Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MEHMET FATİH UÇAR