Geri Dön

An analysis of a multiple imputation model for the missing values in selected variables of tdhs-2003 data: the case of anthropometric measures

Tnsa-2003 verisinde seçilmiş değişkenlerdeki kayıp veriler için bir çoklu imputasyon modeli analizi: antropometrik ölçümler

  1. Tez No: 208006
  2. Yazar: BENGİ UĞUZ
  3. Danışmanlar: ÖĞR. GÖR. AHMET SİNAN TÜRKYILMAZ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Demografi, Çocuk Sağlığı ve Hastalıkları, İstatistik, Demography, Child Health and Diseases, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2007
  8. Dil: İngilizce
  9. Üniversite: Hacettepe Üniversitesi
  10. Enstitü: Nüfus Etütleri Enstitüsü
  11. Ana Bilim Dalı: Demografi Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 128

Özet

Örneklem araştırmaları, nüfus sayımları ve kayıtlarla birlikte en önemli üç sosyal ve demografik veri kaynağından birini oluşturmaktadır. Örneklem araştırmaları, özellikle Türkiye gibi kayıt sistemi yerleşik olmayan ülkeler için en önemli veri kaynağını oluşturmaktadır. Kayıp veri konusu sosyal araştırmalarda oldukça sık rastlanılan bir konudur ve uygun bir şekilde ele alınmadığında yanlı tahminlere neden olmaktadır. Buna rağmen, Türkiye'de kayıp veri konusuyla ilgili teorik ve uygulamalı çalışmaların sayısı oldukça kısıtlıdır. Diğer taraftan Nüfus ve Sağlık Araştırmaları (NSA), yalnızca bazı önemli tarihler için kullanılan bir imputasyon yöntemine sahiptir. Dünyanın en yaygın araştırmalarından biri olan NSA'da, araştırmanın karmaşık yapısı ve soru kağıdı tasarımı bunu en aza indirmeye çalışsa da, birçok değişken kayıp veri ve tutarsızlık sorunuyla karşı karşıyadır. Ayrıca var olan imputasyon tekniklerinde de çeşitli sorunlar bulunmaktadır. Bu çalışmanın genel amacı, Hacettepe Üniversitesi Nüfus Etütleri Enstitüsü tarafından gerçekleştirilen 2003 Türkiye Nüfus ve Sağlık Araştırması'nda yer alan beş yaş altı çocukların antropometrik ölçümleri için çoklu imputasyon modelinin denenmesidir. Çalışmada daha özelinde, sıralı regresyon çoklu imputasyon tekniği kullanılmış ve 20 tamamlanmış veri seti elde edilmiştir. Bu veri setleri daha sonra analiz edilmiş ve gözlenmiş olan veri seti sonuçlarıyla, antropometrik ölçümler ? yaşa göre boy, boya göre kilo ve yaşa göre kilo ? bağlamında karşılaştırılmıştır. Çalışmanın sonuçlarına göre, çoklu imputasyon tekniği ile elde edilen veri gözlenmiş olan veriyi, her iki çalışma değişkeni olan boy ve kilo için dağılım anlamında iyi taklit etmektedir. İmputasyon uygulamasından sonra, antropometrik endeksler için belli değerlerin altında kalan çocukların yüzdesi bir miktar düşmüştür, bu da ölçümü yapılmış ve yapılmamış çocuklar arasında muhtemel bir yanlılığa işaret etmektedir. Ayrıca, çeşitli analizler kayıp veri yüzdelerinin, cevaplayıcının belli özelliklerine göre değiştiğini ortaya koymaktadır. Çalışmada sonuç olarak çoklu imputasyon, boy ve kilo değişkenlerinde var olan cevapsızlığa bağlı yanlılığı düzeltmiş ve gözlem sayısındaki artışa paralel olarak güvenirliği artırmıştır

Özet (Çeviri)

Sample surveys are one of the three main sources of social and demographic data together with the population censuses and vital registrations. They are also the most important source for the countries that are lacking well-established registration systems, such as Turkey. The issue of missing data is a common problem in social surveys and cause biased estimations if not dealt properly. However, the number of theoretical and practical studies on techniques for handling missing data is very limited in Turkey. Demographic and Health Surveys (DHS), on the other hand, use some wellestablished editing and imputation techniques for only dates for several key events. Being one of the most widespread surveys of the world, many variables are exposed to missing data and inconsistency problems in DHS, although its complex design and questionnaire structure aims at minimizing these problems. In addition, existing imputation techniques of DHS have their own shortcomings. The overall objective of this study is to apply the multiple imputation model to the anthropometric measurements of children under age five, in the 2003 Turkey Demographic and Health Survey (TDHS?2003) data, which is implemented by the Hacettepe University Institute of Population Studies. More specifically, sequential regression multiple imputation technique is used for creating 20 completed data sets, which are imputed conditional on the fully observed variables. The completed data sets are then analyzed and the results are compared with the observed data set, particularly for the anthropometric indexes height for age, weight for height and weight for age. According to the results of the study, multiply imputed data well imitated the observed data in terms of distribution for both of the study variables, weight and height. The percentages below certain levels of anthropometric indexes slightly decreased after the imputation application, which indicate a possible bias among the children who were measured and not measured. Moreover, several analyses showed that the percentage of missing data differentiate substantially among some background characteristic categories of the respondent. As a result, multiple imputation corrected for the bias due to nonresponse in weight and height variables and increased reliability in parallel with the increase in number of observed cases

Benzer Tezler

  1. Çoklu atama sonrası propensity skor tahmin yöntemlerine yeni yaklaşımlar

    New methods for estimating propensity scores following multiple imputation

    SEVİNÇ PÜREN YÜCEL KARAKAYA

    Doktora

    Türkçe

    Türkçe

    2024

    BiyoistatistikÇukurova Üniversitesi

    Biyoistatistik Ana Bilim Dalı

    DOÇ. DR. İLKER ÜNAL

  2. Madde Tepki Kuramı Ağaç yaklaşımıyla kayıp verilerin modellenmesinin farklı simülasyon koşullarında parametre kestirimlerine etkisi

    The effect of modelling missing data with the Item Response Theory Tree approach on parameter estimates under different simulation conditions

    YEŞİM BERİL SOĞUKSU

    Doktora

    Türkçe

    Türkçe

    2024

    Eğitim ve ÖğretimAnkara Üniversitesi

    Eğitim Bilimleri Ana Bilim Dalı

    DOÇ. DR. ERGÜL DEMİR

  3. Veri kalitesinde eksik veri sorunlarının derin öğrenme yöntemi ile çözülmesi: Üretici çekişmeli ağlar ile bir uygulama

    Solving missing data problems in data quality with deep learning method: An application with generative adversial networks

    ŞEVHAT DOGER

    Yüksek Lisans

    Türkçe

    Türkçe

    2020

    İşletmeDokuz Eylül Üniversitesi

    Toplam Kalite Yönetimi Ana Bilim Dalı

    PROF. DR. OSMAN AVŞAR KURGUN

  4. Wechsler çocuklar için zeka ölçegi IV Türkçe formundaki maddelerin işlev farklılığının sosyo-ekonomik düzey ve cinsiyet açısından incelenmesi

    An investigation of socioeconomic status and gender bias on wechsler intelligence scale for children: Fourth edition -Turkish form items

    ELİF BENGİ ÜNSAL ÖZBERK

    Doktora

    Türkçe

    Türkçe

    2016

    Eğitim ve ÖğretimAnkara Üniversitesi

    Eğitimde Ölçme ve Değerlendirme Ana Bilim Dalı

    PROF. DR. NİZAMETTİN KOÇ

  5. Sayı ile ifade edilen zaman serilerinde kayıp gözlem analizi: Trafik kazası örneği

    Missing case analysis in time series with count data: Traffic accident

    FURKAN KOÇAL

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    İstatistikOndokuz Mayıs Üniversitesi

    İstatistik Ana Bilim Dalı

    PROF. DR. MEHMET ALİ CENGİZ