An analysis of a multiple imputation model for the missing values in selected variables of tdhs-2003 data: the case of anthropometric measures

Tnsa-2003 verisinde seçilmiş değişkenlerdeki kayıp veriler için bir çoklu imputasyon modeli analizi: antropometrik ölçümler

PDF İndir

Tez No: 208006
Yazar: BENGİ UĞUZ
Danışmanlar: ÖĞR. GÖR. AHMET SİNAN TÜRKYILMAZ
Tez Türü: Yüksek Lisans
Konular: Demografi, Çocuk Sağlığı ve Hastalıkları, İstatistik, Demography, Child Health and Diseases, Statistics
Anahtar Kelimeler: Belirtilmemiş.
Yıl: 2007
Dil: İngilizce
Üniversite: Hacettepe Üniversitesi
Enstitü: Nüfus Etütleri Enstitüsü
Ana Bilim Dalı: Demografi Ana Bilim Dalı
Bilim Dalı: Belirtilmemiş.
Sayfa Sayısı: 128

Özet

Örneklem araştırmaları, nüfus sayımları ve kayıtlarla birlikte en önemli üç sosyal ve demografik veri kaynağından birini oluşturmaktadır. Örneklem araştırmaları, özellikle Türkiye gibi kayıt sistemi yerleşik olmayan ülkeler için en önemli veri kaynağını oluşturmaktadır. Kayıp veri konusu sosyal araştırmalarda oldukça sık rastlanılan bir konudur ve uygun bir şekilde ele alınmadığında yanlı tahminlere neden olmaktadır. Buna rağmen, Türkiye'de kayıp veri konusuyla ilgili teorik ve uygulamalı çalışmaların sayısı oldukça kısıtlıdır. Diğer taraftan Nüfus ve Sağlık Araştırmaları (NSA), yalnızca bazı önemli tarihler için kullanılan bir imputasyon yöntemine sahiptir. Dünyanın en yaygın araştırmalarından biri olan NSA'da, araştırmanın karmaşık yapısı ve soru kağıdı tasarımı bunu en aza indirmeye çalışsa da, birçok değişken kayıp veri ve tutarsızlık sorunuyla karşı karşıyadır. Ayrıca var olan imputasyon tekniklerinde de çeşitli sorunlar bulunmaktadır. Bu çalışmanın genel amacı, Hacettepe Üniversitesi Nüfus Etütleri Enstitüsü tarafından gerçekleştirilen 2003 Türkiye Nüfus ve Sağlık Araştırması'nda yer alan beş yaş altı çocukların antropometrik ölçümleri için çoklu imputasyon modelinin denenmesidir. Çalışmada daha özelinde, sıralı regresyon çoklu imputasyon tekniği kullanılmış ve 20 tamamlanmış veri seti elde edilmiştir. Bu veri setleri daha sonra analiz edilmiş ve gözlenmiş olan veri seti sonuçlarıyla, antropometrik ölçümler ? yaşa göre boy, boya göre kilo ve yaşa göre kilo ? bağlamında karşılaştırılmıştır. Çalışmanın sonuçlarına göre, çoklu imputasyon tekniği ile elde edilen veri gözlenmiş olan veriyi, her iki çalışma değişkeni olan boy ve kilo için dağılım anlamında iyi taklit etmektedir. İmputasyon uygulamasından sonra, antropometrik endeksler için belli değerlerin altında kalan çocukların yüzdesi bir miktar düşmüştür, bu da ölçümü yapılmış ve yapılmamış çocuklar arasında muhtemel bir yanlılığa işaret etmektedir. Ayrıca, çeşitli analizler kayıp veri yüzdelerinin, cevaplayıcının belli özelliklerine göre değiştiğini ortaya koymaktadır. Çalışmada sonuç olarak çoklu imputasyon, boy ve kilo değişkenlerinde var olan cevapsızlığa bağlı yanlılığı düzeltmiş ve gözlem sayısındaki artışa paralel olarak güvenirliği artırmıştır

Özet (Çeviri)

Sample surveys are one of the three main sources of social and demographic data together with the population censuses and vital registrations. They are also the most important source for the countries that are lacking well-established registration systems, such as Turkey. The issue of missing data is a common problem in social surveys and cause biased estimations if not dealt properly. However, the number of theoretical and practical studies on techniques for handling missing data is very limited in Turkey. Demographic and Health Surveys (DHS), on the other hand, use some wellestablished editing and imputation techniques for only dates for several key events. Being one of the most widespread surveys of the world, many variables are exposed to missing data and inconsistency problems in DHS, although its complex design and questionnaire structure aims at minimizing these problems. In addition, existing imputation techniques of DHS have their own shortcomings. The overall objective of this study is to apply the multiple imputation model to the anthropometric measurements of children under age five, in the 2003 Turkey Demographic and Health Survey (TDHS?2003) data, which is implemented by the Hacettepe University Institute of Population Studies. More specifically, sequential regression multiple imputation technique is used for creating 20 completed data sets, which are imputed conditional on the fully observed variables. The completed data sets are then analyzed and the results are compared with the observed data set, particularly for the anthropometric indexes height for age, weight for height and weight for age. According to the results of the study, multiply imputed data well imitated the observed data in terms of distribution for both of the study variables, weight and height. The percentages below certain levels of anthropometric indexes slightly decreased after the imputation application, which indicate a possible bias among the children who were measured and not measured. Moreover, several analyses showed that the percentage of missing data differentiate substantially among some background characteristic categories of the respondent. As a result, multiple imputation corrected for the bias due to nonresponse in weight and height variables and increased reliability in parallel with the increase in number of observed cases

Benzer Tezler

Tez No
910771
Çoklu atama sonrası propensity skor tahmin yöntemlerine yeni yaklaşımlar
New methods for estimating propensity scores following multiple imputation
SEVİNÇ PÜREN YÜCEL KARAKAYA
Doktora
Türkçe
2024
Biyoistatistik Çukurova Üniversitesi
Biyoistatistik Ana Bilim Dalı
DOÇ. DR. İLKER ÜNAL
Tez No
940901
Gaziantep'te PM2.5 konsantrasyonunun zamansal ve mekânsaltahminine yönelik transfer öğrenme destekli hibrit yapay zeka modelleri
Spatio-temporal estimation of PM2.5 concentrations in gaziantepusing transfer learning-based hybrid artificial intelligence models
TÜRKAN ZENGİN GÖMLEKSİZ
Yüksek Lisans
Türkçe
2025
Meteoroloji İstanbul Teknik Üniversitesi
İklim Bilimi ve Meteoroloji Mühendisliği Ana Bilim Dalı
PROF. DR. HÜSEYİN TOROS
Tez No
858411
Madde Tepki Kuramı Ağaç yaklaşımıyla kayıp verilerin modellenmesinin farklı simülasyon koşullarında parametre kestirimlerine etkisi
The effect of modelling missing data with the Item Response Theory Tree approach on parameter estimates under different simulation conditions
YEŞİM BERİL SOĞUKSU
Doktora
Türkçe
2024
Eğitim ve Öğretim Ankara Üniversitesi
Eğitim Bilimleri Ana Bilim Dalı
DOÇ. DR. ERGÜL DEMİR
Tez No
638761
Veri kalitesinde eksik veri sorunlarının derin öğrenme yöntemi ile çözülmesi: Üretici çekişmeli ağlar ile bir uygulama
Solving missing data problems in data quality with deep learning method: An application with generative adversial networks
ŞEVHAT DOGER
Yüksek Lisans
Türkçe
2020
İşletme Dokuz Eylül Üniversitesi
Toplam Kalite Yönetimi Ana Bilim Dalı
PROF. DR. OSMAN AVŞAR KURGUN
Tez No
940538
Kayıp veri ile başa çıkma yöntemlerinin yol analizine ilişkin model uyum indeksleri açısından incelenmesi
An investigation of missing data handling methods in terms of model fit indices in path analysis
ELİF ALADAĞ
Yüksek Lisans
Türkçe
2025
Eğitim ve Öğretim Bolu Abant İzzet Baysal Üniversitesi
Eğitim Bilimleri Ana Bilim Dalı
DOÇ. DR. CEREN MUTLUER

Geri Dön