An analysis of a multiple imputation model for the missing values in selected variables of tdhs-2003 data: the case of anthropometric measures
Tnsa-2003 verisinde seçilmiş değişkenlerdeki kayıp veriler için bir çoklu imputasyon modeli analizi: antropometrik ölçümler
- Tez No: 208006
- Danışmanlar: ÖĞR. GÖR. AHMET SİNAN TÜRKYILMAZ
- Tez Türü: Yüksek Lisans
- Konular: Demografi, Çocuk Sağlığı ve Hastalıkları, İstatistik, Demography, Child Health and Diseases, Statistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2007
- Dil: İngilizce
- Üniversite: Hacettepe Üniversitesi
- Enstitü: Nüfus Etütleri Enstitüsü
- Ana Bilim Dalı: Demografi Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 128
Özet
Örneklem araştırmaları, nüfus sayımları ve kayıtlarla birlikte en önemli üç sosyal ve demografik veri kaynağından birini oluşturmaktadır. Örneklem araştırmaları, özellikle Türkiye gibi kayıt sistemi yerleşik olmayan ülkeler için en önemli veri kaynağını oluşturmaktadır. Kayıp veri konusu sosyal araştırmalarda oldukça sık rastlanılan bir konudur ve uygun bir şekilde ele alınmadığında yanlı tahminlere neden olmaktadır. Buna rağmen, Türkiye'de kayıp veri konusuyla ilgili teorik ve uygulamalı çalışmaların sayısı oldukça kısıtlıdır. Diğer taraftan Nüfus ve Sağlık Araştırmaları (NSA), yalnızca bazı önemli tarihler için kullanılan bir imputasyon yöntemine sahiptir. Dünyanın en yaygın araştırmalarından biri olan NSA'da, araştırmanın karmaşık yapısı ve soru kağıdı tasarımı bunu en aza indirmeye çalışsa da, birçok değişken kayıp veri ve tutarsızlık sorunuyla karşı karşıyadır. Ayrıca var olan imputasyon tekniklerinde de çeşitli sorunlar bulunmaktadır. Bu çalışmanın genel amacı, Hacettepe Üniversitesi Nüfus Etütleri Enstitüsü tarafından gerçekleştirilen 2003 Türkiye Nüfus ve Sağlık Araştırması'nda yer alan beş yaş altı çocukların antropometrik ölçümleri için çoklu imputasyon modelinin denenmesidir. Çalışmada daha özelinde, sıralı regresyon çoklu imputasyon tekniği kullanılmış ve 20 tamamlanmış veri seti elde edilmiştir. Bu veri setleri daha sonra analiz edilmiş ve gözlenmiş olan veri seti sonuçlarıyla, antropometrik ölçümler ? yaşa göre boy, boya göre kilo ve yaşa göre kilo ? bağlamında karşılaştırılmıştır. Çalışmanın sonuçlarına göre, çoklu imputasyon tekniği ile elde edilen veri gözlenmiş olan veriyi, her iki çalışma değişkeni olan boy ve kilo için dağılım anlamında iyi taklit etmektedir. İmputasyon uygulamasından sonra, antropometrik endeksler için belli değerlerin altında kalan çocukların yüzdesi bir miktar düşmüştür, bu da ölçümü yapılmış ve yapılmamış çocuklar arasında muhtemel bir yanlılığa işaret etmektedir. Ayrıca, çeşitli analizler kayıp veri yüzdelerinin, cevaplayıcının belli özelliklerine göre değiştiğini ortaya koymaktadır. Çalışmada sonuç olarak çoklu imputasyon, boy ve kilo değişkenlerinde var olan cevapsızlığa bağlı yanlılığı düzeltmiş ve gözlem sayısındaki artışa paralel olarak güvenirliği artırmıştır
Özet (Çeviri)
Sample surveys are one of the three main sources of social and demographic data together with the population censuses and vital registrations. They are also the most important source for the countries that are lacking well-established registration systems, such as Turkey. The issue of missing data is a common problem in social surveys and cause biased estimations if not dealt properly. However, the number of theoretical and practical studies on techniques for handling missing data is very limited in Turkey. Demographic and Health Surveys (DHS), on the other hand, use some wellestablished editing and imputation techniques for only dates for several key events. Being one of the most widespread surveys of the world, many variables are exposed to missing data and inconsistency problems in DHS, although its complex design and questionnaire structure aims at minimizing these problems. In addition, existing imputation techniques of DHS have their own shortcomings. The overall objective of this study is to apply the multiple imputation model to the anthropometric measurements of children under age five, in the 2003 Turkey Demographic and Health Survey (TDHS?2003) data, which is implemented by the Hacettepe University Institute of Population Studies. More specifically, sequential regression multiple imputation technique is used for creating 20 completed data sets, which are imputed conditional on the fully observed variables. The completed data sets are then analyzed and the results are compared with the observed data set, particularly for the anthropometric indexes height for age, weight for height and weight for age. According to the results of the study, multiply imputed data well imitated the observed data in terms of distribution for both of the study variables, weight and height. The percentages below certain levels of anthropometric indexes slightly decreased after the imputation application, which indicate a possible bias among the children who were measured and not measured. Moreover, several analyses showed that the percentage of missing data differentiate substantially among some background characteristic categories of the respondent. As a result, multiple imputation corrected for the bias due to nonresponse in weight and height variables and increased reliability in parallel with the increase in number of observed cases
Benzer Tezler
- Çoklu atama sonrası propensity skor tahmin yöntemlerine yeni yaklaşımlar
New methods for estimating propensity scores following multiple imputation
SEVİNÇ PÜREN YÜCEL KARAKAYA
Doktora
Türkçe
2024
BiyoistatistikÇukurova ÜniversitesiBiyoistatistik Ana Bilim Dalı
DOÇ. DR. İLKER ÜNAL
- Madde Tepki Kuramı Ağaç yaklaşımıyla kayıp verilerin modellenmesinin farklı simülasyon koşullarında parametre kestirimlerine etkisi
The effect of modelling missing data with the Item Response Theory Tree approach on parameter estimates under different simulation conditions
YEŞİM BERİL SOĞUKSU
Doktora
Türkçe
2024
Eğitim ve ÖğretimAnkara ÜniversitesiEğitim Bilimleri Ana Bilim Dalı
DOÇ. DR. ERGÜL DEMİR
- Veri kalitesinde eksik veri sorunlarının derin öğrenme yöntemi ile çözülmesi: Üretici çekişmeli ağlar ile bir uygulama
Solving missing data problems in data quality with deep learning method: An application with generative adversial networks
ŞEVHAT DOGER
Yüksek Lisans
Türkçe
2020
İşletmeDokuz Eylül ÜniversitesiToplam Kalite Yönetimi Ana Bilim Dalı
PROF. DR. OSMAN AVŞAR KURGUN
- Wechsler çocuklar için zeka ölçegi IV Türkçe formundaki maddelerin işlev farklılığının sosyo-ekonomik düzey ve cinsiyet açısından incelenmesi
An investigation of socioeconomic status and gender bias on wechsler intelligence scale for children: Fourth edition -Turkish form items
ELİF BENGİ ÜNSAL ÖZBERK
Doktora
Türkçe
2016
Eğitim ve ÖğretimAnkara ÜniversitesiEğitimde Ölçme ve Değerlendirme Ana Bilim Dalı
PROF. DR. NİZAMETTİN KOÇ
- Sayı ile ifade edilen zaman serilerinde kayıp gözlem analizi: Trafik kazası örneği
Missing case analysis in time series with count data: Traffic accident
FURKAN KOÇAL
Yüksek Lisans
Türkçe
2021
İstatistikOndokuz Mayıs Üniversitesiİstatistik Ana Bilim Dalı
PROF. DR. MEHMET ALİ CENGİZ