Lojistik regresyonda çoklu aykırı gözlemlerin belirlenmesi ve etkililiklerinin incelenmesi
Detection of multiple outliers in logistic regression and examination of effectiveness
- Tez No: 312817
- Danışmanlar: PROF. DR. M. AKİF BAKIR
- Tez Türü: Yüksek Lisans
- Konular: İstatistik, Statistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2011
- Dil: Türkçe
- Üniversite: Gazi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: İstatistik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 91
Özet
Regresyon, bağımlı değişken ile bir veya daha çok bağımsız değişken arasındaki ilişkiyi incelemek amacıyla kullanılan bir analiz yöntemidir. Regresyon analizinde bağımlı değişken genellikle sürekli ve ölçülebilir alınır. Ancak bazı durumlarda bağımlı değişken kesiklidir ve sadece iki uçlu değerler alabilir. Böyle durumlarda bağımlı değişken Binom olasılık dağılımına sahip olacağından regresyon modelini bir olasılık modeli olarak kurmak gerekir. Bu bağlamda regresyon modeli lojistik dağılım fonksiyonuna dayalı olarak yazılabilir. Doğrusal regresyon modellerinde olduğu gibi, lojistik regresyon modellerinde de veri kümesi uzayının uçlarında yer alan noktalar olabilir. Aykırı gözlem olarak bilinen bu gözlemlerin belirlenmesi ve regresyon fonksiyonunun uyum iyiliği ve/veya parametre tahminleri üzerine etkisi olup olmadığının irdelenmesi gerekir. Aykırı gözlemlerin belirlenmesine yönelik bazı tek gözlem yöntemleri geliştirilmiştir. Uygulamada sıkça rastlanan yaklaşım, aykırı gözlemlerin bu türden yöntemlerle incelenmesidir. Ancak maskeleme (masking) ve sahte aykırı gözlem (swamping) problemi söz konusu olduğunda tek gözlem yöntemleri başarısız olur. Bu nedenle bu problemlerden etkilenmeyecek bir yönteme ihtiyaç duyulmaktadır. Bu çalışmada, lojistik regresyonda çoklu aykırı gözlemlerin belirlenmesinde etkili bir şekilde kullanılabilecek olan Genelleştirilmiş Standart Pearson Artıkları (GSPR) yöntemi Türkiye 2009 Elit Bayan Voleybol ligine ve firma iflaslarına ilişkin verilere uygulanarak yöntemin etkin biçimde çalıştığı ve maskeleme etkisini giderdiği gösterilmiştir.
Özet (Çeviri)
Regression is a method of analysis performed to examine the relationship between a dependent variable and one or more independent variables. In regression analysis, dependent variable is generally held continuous and measurable. But in some cases, dependent variable is binary and it takes only discrete values. Since dependent variable has binominal probability distribution in such cases, regression model should be set up as a probability model. In that sense, regression model can be designed in accordance with logistic distribution function. Like the linear regression models, there may be points at the end of the data set space also in logistic regressions. These observations which are known as outlier observations need to be determined and it should be elaborated whether they have any impact on goodness of fit of the regression functions and/or parameter estimates. Some single observation methods have been developed to identify outliers. The most frequent approach in practice is using such kind of methods to examine the outliers. However, in case of masking and swamping, single observation methods fail. Therefore, a method which will not be affected by these problems is required. In this study, the method of Generalised Standard Pearson Residuals (GSPR) which can be used effectively for identification of multiple outliers in logistic regression has been applied to the data concerning Turkey 2009 Elite Women Volleyball League and firm bankrupties and it has been proved that the method works effectively and eliminates the effect of masking.
Benzer Tezler
- Derin öğrenme ve büyük veri analitiği yöntemleriKullanarak Covid-19 yayılımının ileriye dönük tahmini
Forecasting the spread of covid-19 using deep learning and big data analytics methods
CYLAS KIGANDA
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilgisayar Bilimleri Ana Bilim Dalı
PROF. DR. MUHAMMET ALİ AKCAYOL
- Sınıflandırma yöntemlerinin performansının üretilmiş ve gerçek veri setleri kullanılarak incelenmesi
Analyzing the performance of classification methods using generated and real datasets
ÇİĞDEM KADAİFÇİ YANMAZ
Yüksek Lisans
Türkçe
2024
İstatistikMimar Sinan Güzel Sanatlar Üniversitesiİstatistik Ana Bilim Dalı
PROF. DR. EYLEM DENİZ HOWE
- İkili lojistik regresyonda robust yöntemler
Robust methods in binary logistics regression
EBRU GÜNDOĞAN AŞIK
Doktora
Türkçe
2023
İstatistikKaradeniz Teknik Üniversitesiİstatistik ve Bilgisayar Bilimleri Ana Bilim Dalı
PROF. DR. ZAFER KÜÇÜK
PROF. DR. ARZU ALTIN YAVUZ
- Lojistik elastik net yönteminin alternatif yöntemlerle karşılaştırılması
Comparison of the logistic elastic net method with alternative methods
SEVİM SİMGE UYSAL
Yüksek Lisans
Türkçe
2020
İstatistikEskişehir Osmangazi Üniversitesiİstatistik Ana Bilim Dalı
PROF. DR. ARZU ALTIN YAVUZ
- Modeling educational data with machine learning methods
Eğitim verilerinin makine oğrenmesi algoritmaları kullanılarak modellenmesi
AYŞE İLKNUR DİLEK
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Kültür ÜniversitesiMatematik ve Bilgisayar Bilimleri Ana Bilim Dalı
DR. ÖĞR. ÜYESİ MEHMET FATİH UÇAR