Sayma verileri için sıfır yığılmalı modellerin karşılaştırılması
Comparing zero-inflated models for count data
- Tez No: 509285
- Danışmanlar: PROF. DR. SEMRA ERBAŞ
- Tez Türü: Doktora
- Konular: İstatistik, Statistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2018
- Dil: Türkçe
- Üniversite: Gazi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: İstatistik Ana Bilim Dalı
- Bilim Dalı: İstatistik Bilim Dalı
- Sayfa Sayısı: 96
Özet
Sayma verilerinde genellikle gözlemlerin aşırı yayılımlı olması ve fazla sayıda sıfır değerlerini içerdiği durumlar ile birçok alanda karşılaşılmaktadır. Normallik, homojen varyans ve otokorelasyon gibi varsayımlar sağlanmadığından sayma verilerin analizinde klasik doğrusal regresyon modellerin kullanılması yanlı ve yetersiz tahmin sonuçları verebilmektedir. Bu tür verilerin Poisson ve Negatif binom dağılımlarına uygunluğu nedeniyle sayma verilerin modellenmesinde bu dağılımlara dayalı çeşitli modeller geliştirilmiştir. Poisson, Negatif Binom, sıfır yığılmalı Poisson, sıfır yığılmalı Negatif Binom, Poisson Hurdle ve Negatif Binom Hurdle regresyon modelleri sayma verileri analiz etmede yaygın olarak kullanılmaktadır. Fakat hem gerçek verilerle hem de yapay verilerle yapılan çalışmalarda, bu modellerin birbirlerine üstünlükleri konusunda net bulguların olmadığı anlaşılmıştır. Bu çalışmada, sayma veri modellerinin performanslarına ilişkin farklı durumlar hem simülasyon çalışmasıyla hem de gerçek bir veri seti ile ele alınmaya çalışılmıştır. Farklı oranlardaki sıfır değerlerinin ve aykırı değerlerin sayma veri modellerinin performanslarını nasıl etkilediği incelenmiştir. Sayma veri modellerinin performanslarını karşılaştırmak amacıyla yapay veri ile incelenen farklı senaryoların yer aldığı durumlar, 2014 Türkiye Sağlık Araştırması verileri kullanılarak gerçek bir veri seti ile de analiz edilmiştir. Model performanslarını karşılaştırmak amacıyla AIC bilgi kriteri kullanılmıştır. Çalışma sonucunda, sıfır yığılmalı Negatif Binom ve Negatif Binom Hurdle regresyon modellerinin diğer modellere göre daha başarılı olduğu bulunmuştur. Aynı zamanda bazı senaryolarda Negatif Binom regresyon modelinin aşırı sıfır yoğunluğu ve/veya aykırı değer varlığında diğer modellerden üstün olduğu görülmüştür.
Özet (Çeviri)
In many applications, there are many cases that count data generally have overdispersion and high proportion of zeros. Because the assumptions of the ordinary least-squares regression are violated (normality, homoscedasticity and linearity), the use of these statistical techniques generally causes biased and inefficient results. Due to the compatibility of such data with poisson and negative binomial distributions, various models based on these distributions have been developed in the modeling of count data. Poisson, Negative Binomial, zero-inflated Poisson, zero-inflated Negative Binomial, Poisson hurdle and Negative Binomial hurdle regression models are widely used to analyze count data. However, it has been understood that there are no clear findings about the superiority of these models to each other, both in terms of real data and artificial data. In this study, different situations related to the performance of the count data models have been tried to be handled both with the simulation study and with a real data set. In this direction, how zero values at different ratios and outliers affect the performance of count data models is examined. In order to compare the performance of count data models with the situations involving different scenarios examined by the artificial data, were also analyzed with a real data set by using 2014 Turkey Health Survey data. AIC was used to compare model performances. We found that Zero-Inflated Negative Binomial and Negative Binomial Hurdle models were found to be more successful than other count data models. Also the results indicated that in some scenarios, the Negative Binomial model outperforms other models in the presence of excess zeros and/or outliers.
Benzer Tezler
- Sayma verisi için regresyon modelleri: Türkiye gelir ve yaşam koşulları araştırması üzerine bir uygulama
Regression models for count data: An application on income and living conditions surveys in Turkey
ONUR ŞENTÜRK
- Sayma verileri ile regresyon analizi ve talep verilerine uygulanması
Regression analysis with counting data and its application to demand data
DİCLEHAN ŞEKER
Yüksek Lisans
Türkçe
2022
EkonometriSivas Cumhuriyet ÜniversitesiEkonometri Ana Bilim Dalı
PROF. DR. HAKAN TÜRKAY
- Bell tipi regresyon modelleri ve artıkların incelenmesi
Bell type regression models and analysis of residuals
DUYGU KILIÇ
- Türkiye'de bebek ölümlerini etkileyen faktörler: Sayma veri modelleri ile karşılaştırmalı bir analiz
Factors affecting infant mortality in Turkey: A comparative analysis with count data models
GİZEM KILINÇ
Yüksek Lisans
Türkçe
2021
EkonometriManisa Celal Bayar ÜniversitesiEkonometri Ana Bilim Dalı
PROF. DR. SİBEL SELİM
- Sayma verisi için regresyon modelleri ve bir uygulama
Count data regression models and an application
GÖZDE NUR DİNARCAN
Yüksek Lisans
Türkçe
2018
İstatistikHacettepe Üniversitesiİstatistik Ana Bilim Dalı
PROF. DR. MERAL ÇETİN