Geri Dön

Sayma verileri için sıfır yığılmalı modellerin karşılaştırılması

Comparing zero-inflated models for count data

  1. Tez No: 509285
  2. Yazar: MUHAMMED FATİH TÜZEN
  3. Danışmanlar: PROF. DR. SEMRA ERBAŞ
  4. Tez Türü: Doktora
  5. Konular: İstatistik, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2018
  8. Dil: Türkçe
  9. Üniversite: Gazi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: İstatistik Bilim Dalı
  13. Sayfa Sayısı: 96

Özet

Sayma verilerinde genellikle gözlemlerin aşırı yayılımlı olması ve fazla sayıda sıfır değerlerini içerdiği durumlar ile birçok alanda karşılaşılmaktadır. Normallik, homojen varyans ve otokorelasyon gibi varsayımlar sağlanmadığından sayma verilerin analizinde klasik doğrusal regresyon modellerin kullanılması yanlı ve yetersiz tahmin sonuçları verebilmektedir. Bu tür verilerin Poisson ve Negatif binom dağılımlarına uygunluğu nedeniyle sayma verilerin modellenmesinde bu dağılımlara dayalı çeşitli modeller geliştirilmiştir. Poisson, Negatif Binom, sıfır yığılmalı Poisson, sıfır yığılmalı Negatif Binom, Poisson Hurdle ve Negatif Binom Hurdle regresyon modelleri sayma verileri analiz etmede yaygın olarak kullanılmaktadır. Fakat hem gerçek verilerle hem de yapay verilerle yapılan çalışmalarda, bu modellerin birbirlerine üstünlükleri konusunda net bulguların olmadığı anlaşılmıştır. Bu çalışmada, sayma veri modellerinin performanslarına ilişkin farklı durumlar hem simülasyon çalışmasıyla hem de gerçek bir veri seti ile ele alınmaya çalışılmıştır. Farklı oranlardaki sıfır değerlerinin ve aykırı değerlerin sayma veri modellerinin performanslarını nasıl etkilediği incelenmiştir. Sayma veri modellerinin performanslarını karşılaştırmak amacıyla yapay veri ile incelenen farklı senaryoların yer aldığı durumlar, 2014 Türkiye Sağlık Araştırması verileri kullanılarak gerçek bir veri seti ile de analiz edilmiştir. Model performanslarını karşılaştırmak amacıyla AIC bilgi kriteri kullanılmıştır. Çalışma sonucunda, sıfır yığılmalı Negatif Binom ve Negatif Binom Hurdle regresyon modellerinin diğer modellere göre daha başarılı olduğu bulunmuştur. Aynı zamanda bazı senaryolarda Negatif Binom regresyon modelinin aşırı sıfır yoğunluğu ve/veya aykırı değer varlığında diğer modellerden üstün olduğu görülmüştür.

Özet (Çeviri)

In many applications, there are many cases that count data generally have overdispersion and high proportion of zeros. Because the assumptions of the ordinary least-squares regression are violated (normality, homoscedasticity and linearity), the use of these statistical techniques generally causes biased and inefficient results. Due to the compatibility of such data with poisson and negative binomial distributions, various models based on these distributions have been developed in the modeling of count data. Poisson, Negative Binomial, zero-inflated Poisson, zero-inflated Negative Binomial, Poisson hurdle and Negative Binomial hurdle regression models are widely used to analyze count data. However, it has been understood that there are no clear findings about the superiority of these models to each other, both in terms of real data and artificial data. In this study, different situations related to the performance of the count data models have been tried to be handled both with the simulation study and with a real data set. In this direction, how zero values at different ratios and outliers affect the performance of count data models is examined. In order to compare the performance of count data models with the situations involving different scenarios examined by the artificial data, were also analyzed with a real data set by using 2014 Turkey Health Survey data. AIC was used to compare model performances. We found that Zero-Inflated Negative Binomial and Negative Binomial Hurdle models were found to be more successful than other count data models. Also the results indicated that in some scenarios, the Negative Binomial model outperforms other models in the presence of excess zeros and/or outliers.

Benzer Tezler

  1. Sayma verisi için regresyon modelleri: Türkiye gelir ve yaşam koşulları araştırması üzerine bir uygulama

    Regression models for count data: An application on income and living conditions surveys in Turkey

    ONUR ŞENTÜRK

    Yüksek Lisans

    Türkçe

    Türkçe

    2020

    İstatistikGazi Üniversitesi

    İstatistik Ana Bilim Dalı

    DOÇ. DR. HÜLYA OLMUŞ

  2. Sayma verileri ile regresyon analizi ve talep verilerine uygulanması

    Regression analysis with counting data and its application to demand data

    DİCLEHAN ŞEKER

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    EkonometriSivas Cumhuriyet Üniversitesi

    Ekonometri Ana Bilim Dalı

    PROF. DR. HAKAN TÜRKAY

  3. Bell tipi regresyon modelleri ve artıkların incelenmesi

    Bell type regression models and analysis of residuals

    DUYGU KILIÇ

    Doktora

    Türkçe

    Türkçe

    2023

    İstatistikGazi Üniversitesi

    İstatistik Ana Bilim Dalı

    PROF. DR. HÜLYA BAYRAK

  4. Türkiye'de bebek ölümlerini etkileyen faktörler: Sayma veri modelleri ile karşılaştırmalı bir analiz

    Factors affecting infant mortality in Turkey: A comparative analysis with count data models

    GİZEM KILINÇ

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    EkonometriManisa Celal Bayar Üniversitesi

    Ekonometri Ana Bilim Dalı

    PROF. DR. SİBEL SELİM

  5. Sayma verisi için regresyon modelleri ve bir uygulama

    Count data regression models and an application

    GÖZDE NUR DİNARCAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    İstatistikHacettepe Üniversitesi

    İstatistik Ana Bilim Dalı

    PROF. DR. MERAL ÇETİN