Heterojenliğin sağlık sigortalarında toplam hasar modellerine etkisi
Impact of heterogeneity on aggregate loss models in health insurance
- Tez No: 430903
- Danışmanlar: YRD. DOÇ. DR. UĞUR KARABEY
- Tez Türü: Doktora
- Konular: Aktüerya Bilimleri, Actuarial Sciences
- Anahtar Kelimeler: kestirim, toplam hasar, genelleştirilmiş doğrusal model, genelleştirilmiş doğrusal karma model, rassal etkiler, marjinal ortalama, korelasyon, prediction, aggregate loss, generalized linear model, generalized linear mixed model, random effects, marginal mean, correlation
- Yıl: 2016
- Dil: Türkçe
- Üniversite: Hacettepe Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Aktüerya Bilimleri Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 129
Özet
Hayat dışı sigortada saf prim hasar frekansı ve hasar şiddetinin çarpılmasıyla elde edilmektedir. Genelleştirilmiş doğrusal modeller (GDM) hasar frekansı ve hasar şiddetinin modellenmesinde sıklıkla kullanılan bir yöntemdir. Genelleştirilmiş doğrusal modellerde gözlemlerin birbirinden bağımsız olduğu varsayılmaktadır. Ancak sağlık sigortası gibi bireylerin birden fazla hasar bildirme eğiliminin olduğu bir sigorta verisinde aynı bireyin tekrarlanan hasar tutarları arasında korelasyon olabilir. Tekrarlanan ölçümler arasındaki korelasyon üzerinde etkisi olan değişkenliğin kaynaklarından biri bireyler arasındaki heterojenliktir. Tekrarlanan ölçümlerin modellenmesi için temel olarak iki yaklaşım kullanılmaktadır: Bireye-özgü modeller ve marjinal (kitle üzerinden ortalaması alınmış) modeller. Bireye-özgü modellerde heterojenlik rassal etkiler kullanılarak açık biçimde modellenmektedir. Marjinal modellerde bağımlı değişken bireyler arasındaki heterojenlik göz önüne alınmadan açıklayıcı değişkenlerin bir fonksiyonu olarak modellenmektedir. Marjinal modellerde parametre tahmini için genelleştirilmiş tahmin denklemleri (GTD) kullanılmaktadır. Bu çalışmada, bireyler arasındaki heterojenliğin beklenen toplam hasar tutarı üzerindeki etkisinin araştırılması amacıyla bireylerin toplam hasar tutarı için alternatif bir kestirici önerilmiştir. Bu amaç doğrultusunda, bireyler arasındaki heterojenliğin göz önüne alınması için bireylerin her bir hasarda oluşan tutarları genelleştirilmiş doğrusal karma model (GDKM) ile modellenmiştir. Sağlık sigortası gibi yıllık yenilenebilir sigortada aynı poliçe sahiplerinin yıllar üzerinden takip edilmesinin zor olması nedeniyle marjinal kestirimlere odaklanılmıştır. Bu doğrultuda GDKM'de tanımlanan koşullu ortalamanın rassal etkilerin dağılımı üzerinden ortalaması alınarak marjinal ortalama elde edilmiştir. Hasar şiddeti ile hasar frekansı arasındaki bağımlılığın modellenmesi için hasar sayısı GDKM'de açıklayıcı değişken olarak kullanılmıştır. Hasar sayısı poliçe yılı başında bilinmediğinden hasar sayısı değişkeninin dağılımından yararlanılarak toplam hasar tutarının kestiricisinin kapalı-şekil ifadesi elde edilmiştir. Çalışmanın uygulama kısmında, Türkiye'de faaliyet gösteren özel bir sigorta şirketinden alınan sağlık sigortası verisi kullanılmıştır. Çalışmada önerilen kestirimci modelin kestirim performansı, tek-kısım modeller, iki-kısım modeller, toplam hasar modeli, her bir hasarda oluşan tutarların marjinal model ve doğrusal karma model ile modellendiği kestirimci modeller ile karşılaştırılmıştır. Hasar tutarları lognormal ve gamma dağılım varsayımı altında modellenmiştir. Frekans-şiddet modellerinde hasar sayılarının modellenmesi için sıfır-yığılmalı model, hurdle model ve negatif binom GDM kullanılmıştır. Analiz sonuçlarına göre, sıfır-yığılmalı negatif binom modeli ve hurdle negatif binom modeli sigorta hasar sayılarına negatif binom GDM'den daha iyi uyum göstermiştir. Hasar sayısının açıklayıcı değişken olarak kullanıldığı tüm hasar şiddeti modellerinde istatistiksel olarak anlamlı olduğu görülmüştür. Modellerin kestirim performanslarının değerlendirilmesinde hem iç model doğrulama hem dış model doğrulama yöntemlerinden yararlanılmıştır. Kestirim hatalarının hesaplanmasında hata kareler ortalamasının karekökü ve ortalama mutlak hata kriterleri kullanılmıştır. Ortalama mutlak hataya göre, her bir hasarda oluşan tutarların marjinalleştirilmiş GDKM ile modellendiği çalışmada önerilen kestirimci model diğer kestirimci modellere göre daha iyi performans göstermiştir.
Özet (Çeviri)
Pure premium is obtained as the product of claim frequency and claim severity in non-life insurance. Generalized linear models (GLM) is a commonly used method for modeling claim frequency and claim severity. Observations are assumed to be independent in GLMs. However there may exist correlation between the repeated claim amounts of the same individual in an insurance data such as health insurance where people have a tendency to notify more than one claim. One of the sources of variability that has an impact on correlation among repeated measures is between-individual heterogeneity. There are two main approaches to model repeated measures: Subject-specific models and marginal (population-averaged) models. Heterogeneity is explicitly modeled by using random effects in subject-specific models. In marginal models dependent variable is modeled as a function of explanatory variables without taking into account between-individual heterogeneity. The method of generalized estimating equation (GEE) is used to estimate the parameters of marginal models. In this study an alternative predictor of total claim amount of individuals is suggested to investigate the impact of between-individual heterogeneity on expected total claim amount. In order to do this, claim amounts per claim of the individuals are modeled by generalized linear mixed model (GLMM) to account for the heterogeneity among individuals. Since it is difficult to follow the same policyholders over the years for annually renewable insurance contracts such as health insurance, the focus is on marginal predictions. Accordingly, marginal mean is obtained by averaging the conditional mean in GLMM over the distribution of random effects. To model the dependence between claim severity and claim frequency, claim number is used as an explanatory variable in GLMM. Since the number of claims is not known at the beginning of the policy year, closed-form predictor of total claim amount is obtained by using the distribution of the claim number variable. In application part of the study, a private health insurance data set of a Turkish insurance company is used. The prediction performance of the suggested predictive model is compared to one-part models, two-parts models, aggregate loss model and predictive models in which claim amounts per claim are modeled with marginal model and linear mixed model. Claim amounts are modeled with lognormal and gamma distribution. In frequency-severity models, claim numbers are modeled by zero-inflated model, hurdle model and negative binomial GLM. Based on analysis results, zero-inflated negative binomial model and hurdle negatif binomial model show better fit to insurance claim numbers than negative binomial GLM. Claim number is found to be statistically significant in all severity models in which it is used as an explanatory variable. To evaluate the predictive performance of the models both internal and external model validation methods are used. To calculate prediction errors, root mean square error and mean absolute error criteria are used. Based on mean absolute error purposed predictive model that is obtained by modeling claim amounts per claim by marginalized GLMM showed better performance than the other predictive models.
Benzer Tezler
- Meta analizinde heterojenliğin saptanmasında kullanılan yöntemlerin simülasyon tekniği ile karşılaştırılması
Methods used for the detection of heterogeneity in Meta-Analysis comparison with simulation technique
SEMRA ERDOĞAN
Doktora
Türkçe
2011
BiyoistatistikMersin ÜniversitesiBiyoistatistik ve Tıbbi Bilişim Ana Bilim Dalı
DOÇ. DR. E. ARZU KANIK
- Meta-analizler için güç değerlendirmesi
Evaluation of the power for meta-analyses
NAZLI TOTİK
Yüksek Lisans
Türkçe
2017
BiyoistatistikÇukurova ÜniversitesiBiyoistatistik Ana Bilim Dalı
PROF. DR. ZELİHA NAZAN ALPARSLAN
- Meta analizde heterojenlik testinin bir örnek üzerinde uygulaması
Using heterogeneity test with an example in meta analysis
KAMBER KAŞALİ
- Takip araştırmalarında tekrarlanan başarısızlıkların modellenmesi: Göğüs hastalıkları veri seti üzerinde bir uygulama
Modeling of unsuccessful repeated in follow-up research: Application on a data set about chest diseases
ŞİRİN ÇETİN
Doktora
Türkçe
2017
BiyoistatistikAnkara ÜniversitesiBiyoistatistik Ana Bilim Dalı
DOÇ. DR. SERDAL KENAN KÖSE
- Meta analizinde aykırı değerlerin incelenmesi ve aykırı değerlerin olduğu durumda kullanılan yöntemlerin karşılaştırılması
Examination of outliers in meta-analysis and comparison of methods used in outliers
MÜMTAZ MUTLU UMAROĞLU
Doktora
Türkçe
2020
BiyoistatistikHacettepe ÜniversitesiBiyoistatistik Ana Bilim Dalı
PROF. DR. PINAR ÖZDEMİR