Geri Dön

An evaluation of statistical matching methods: An application on Turkey income and living conditions survey and household budget survey

İstatistiksel eşleştirme yöntemlerinin değerlendirilmesi: Türkiye gelir ve yaşam koşulları anketi ile hanehalkı bütçe anketi üzerine bir uygulama

  1. Tez No: 745931
  2. Yazar: CENGİZ ÖZKAN
  3. Danışmanlar: PROF. DR. AHMET SİNAN TÜRKYILMAZ
  4. Tez Türü: Doktora
  5. Konular: İstatistik, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: İngilizce
  9. Üniversite: Hacettepe Üniversitesi
  10. Enstitü: Nüfus Etütleri Enstitüsü
  11. Ana Bilim Dalı: Sosyal Araştırma Yöntemleri Anabilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 158

Özet

Bu tez, istatistiksel eşleştirme yöntemlerinin etkinliğinin karşılaştırmalı bir bakış açısıyla değerlendirilmesini amaçlamaktadır. Literatürdeki çalışmalar daha çok non-parametrik mikro yöntemler üzerine odaklandığından, makro, mikro, mixed, parametric ve non-parametrik yöntemleri bütüncül ve karşılaştırmalı olarak ele alan bir araştırmanın yapılmasının yanı sıra farklı donor sınıflarının ve örneklem büyüklüğünde yapılacak müdahalelerin etkilerinin gözlemlenmesi amaçlanmıştır. Ayrıca eşleşme değişkenlerinin seçim süreçlerine dair prosedürlerin, tasarım değişkenleri ve ağırlıkların ilk kez dâhil edilerek genişletilmesi ve etkinliklerinin yeniden değerlendirilmesi amaçlanmıştır. Opsiyonların da süreçlere dâhil edilmesi ile yöntemler arası eşleştirmenin etkinliğinin gözlemlenmesi, uygulamaya dönük sınırlılıkların belirlenmesi ve müdahaleye açık konuların test edilmesi hedeflenmiştir. Karmaşık örneklem tasarımı yapılarına sahip Türkiye Gelir ve Yaşam Koşulları Araştırması ile Hanehalkı Bütçe Araştırması 2018 yılı veri setleri kullanılarak eşleştirme değişkenlerinin seçimi ve istatistiksel eşleştirme yöntemleri üzerine uygulamalar yapılmıştır. Anket verileri uyumlu hale getirildikten sonra, çıktıların üretilmesi için bahsedilen kırılımlar dikkate alınarak makro ve mikro düzeyde parametrik, parametrik olmayan ve karma yöntemler uygulanmıştır. İmputasyon prosedürü, random hot deck, rank hot deck ve nearest neighbor distance hot deck, parametrik olmayan mikro yöntemlerde kullanılmıştır. İdari kayıtlar ve anket verileri gibi mevcut veri kaynakları kullanılarak yüksek kalitede, hızlı, daha düşük maliyetli ve zamanlılık ilkesine uygun veri üretimine imkân veren istatistiksel eşleştirme yöntemleri aynı zamanda cevaplayıcı yükünün ve anketör yanlılığının azaltılması gibi teorik istatistiki yaklaşımlar açısından da olumlu katkılar sağlayacak potansiyele sahiptir. Yöntem, yoksulluk ve doğurganlık arasındaki ilişkiyi bulmayı amaçlayan demografi çalışmalarında da kullanılmaktadır. Sonuçlar, ağırlıklı ve ağırlıksız mikro eşleştirme uygulamalarının bize son derece doğru ve güvenilir tahminler sağladığını göstermektedir. Karma yöntemlerin gözlem büyüklüğü ile ilgili sınırlılıkları tespit edilmiş olsa da kaliteli sentetik veri üretimi açısından etkin oldukları gözlemlenmiştir. Parametrik yöntemler ise veri entegrasyonu açısından beklenen kalitede sonuçlar vermemiştir.

Özet (Çeviri)

The dissertation aims to evaluate the effectiveness of statistical matching methods from a comparative perspective. Since the studies in the literature mostly focus on non-parametric micro methods, it is aimed to conduct a study that deals with macro, micro, mixed, parametric and non-parametric methods in a holistic and comparative way as well as to observe the effects of different donor classes, and interventions in the sample size. In addition, it is aimed to expand the procedures regarding the selection processes of matching variables by including survey design variables and weights for the first time and to re-evaluate their effectiveness. With the inclusion of options in the processes, it is also aimed to observe the efficiency of matching between methods, to determine the practical limitations and to test the issues that are open to intervention. Applications were made on the selection of matching variables and statistical matching methods using the 2018 datasets of the Turkey Statistics on Income and Living Conditions and Household Budget Survey, which have complex sample design features. After the survey data were harmonized, parametric, non-parametric and mixed methods were applied at the macro and micro levels, considering the mentioned breakdowns to produce the outputs. Imputation procedure, random hot deck, rank hot deck and nearest neighbor distance hot deck were used in non-parametric micro methods. Statistical matching methods, which allow the production of high quality, faster, lower cost and timeliness data by using existing data sources such as administrative records and survey data, also have the potential to provide positive contributions in terms of theoretical statistical approaches such as reducing the response burden and interviewer bias. The method is also used for demography studies that aim to find the correlation between poverty and fertility. The results show that weighted and unweighted micro matching applications provide us with highly accurate and reliable estimations. Although the limitations of the mixed methods regarding the size of the observations have been determined, it has been observed that they are effective in producing quality synthetic data. Parametric methods, on the other hand, did not give the expected quality results on data integration.

Benzer Tezler

  1. Sigortacılık sisteminde aktif-pasif yönetimi ve Türkiye hayat sigortası örneğinde portföy performansının boyutlarını belirleyen faktörlerin irdelenmesine ilişkin bir model denemesi

    Assets and liablity management in the insurance sector and investigating sectors that are determinating dimensions of the portfolio performance by relating to model testing in the Turkish life insurance sector

    ALİ İHSAN DOĞAN

    Doktora

    Türkçe

    Türkçe

    2001

    SigortacılıkMarmara Üniversitesi

    Bankacılık Ana Bilim Dalı

    PROF.DR. ABDÜLGAFFAR AĞAOĞLU

  2. Meme kanserli kadınların, birinci derece akrabalarının bilgi arama davranışlarının değerlendirilmesi ve bilgi gereksinimlerinin giderilmesinde eğitimin etkinliği

    The evaluation of information search behaviours of first degree relatives of women having breast cancer and the effectiveness of education in meeting the information needs

    NURAN GENÇTÜRK (TEKE)

    Doktora

    Türkçe

    Türkçe

    2004

    Hemşirelikİstanbul Üniversitesi

    Hemşirelik Ana Bilim Dalı

    PROF.DR. NERİMAN AKYOLCU

  3. Eski haritaların modern haritalar ile karşılaştırılması: Mapanalyst

    Comparison with the modern maps on the old maps: Mapanalyst

    GÜLİN ÇELİK

    Yüksek Lisans

    Türkçe

    Türkçe

    2016

    Jeodezi ve Fotogrametriİstanbul Teknik Üniversitesi

    Geomatik Mühendisliği Ana Bilim Dalı

    PROF. DR. CENGİZHAN İPBÜKER

  4. Çalışma sermayesi yönetimi stratejileri

    Başlık çevirisi yok

    NİHAL KAHRIMAN ALPAY

    Yüksek Lisans

    Türkçe

    Türkçe

    1998

    Mühendislik Bilimleriİstanbul Teknik Üniversitesi

    İşletme Mühendisliği Ana Bilim Dalı

    PROF. DR. CUDİ TUNCER GÜRSOY

  5. Doğal dil işlemede çizgesel ve olasılık tabanlı bir otomatik öğrenme uygulaması

    A machine learning application in natural language processing based on probabilistic graph models

    HAYRİ VOLKAN AGUN

    Yüksek Lisans

    Türkçe

    Türkçe

    2008

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolTrakya Üniversitesi

    Bilgisayar Mühendisliği Bölümü

    YRD. DOÇ. DR. ERDEM UÇAR

    YRD. DOÇ. DR. YILMAZ KILIÇASLAN