Geri Dön

Boylamsal veri analizi ile dengeli olmayan tekrarlı ölçümlerin modellenmesi

Longitudinal data analysis in the modeling of unbalanced repeated measurements

  1. Tez No: 409623
  2. Yazar: DUYGU SIDDIKOĞLU
  3. Danışmanlar: PROF. DR. ZELİHA NAZAN ALPARSLAN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Biyoistatistik, Biostatistics
  6. Anahtar Kelimeler: boylamsal çalışmalar, dengeli olmayan veri, kovaryans yapısı, model oluşturma, tekrarlı ölçümler, longitudinal studies, unbalanced data, covariance structure, model fitting, repeated measures
  7. Yıl: 2015
  8. Dil: Türkçe
  9. Üniversite: Çukurova Üniversitesi
  10. Enstitü: Sağlık Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Biyoistatistik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 133

Özet

Boylamsal çalışmalar, verilerin birbirini takip eden zamanlarda aynı bireyler üzerinde deneysel veya gözlemsel ölçümlerin tekrarlanarak elde edildiği çalışmalardır. Tekrar eden cevap değişkeninin zaman içindeki seyri ve faktörlerin seyir üzerindeki etkisi, tıp alanında yapılan birçok çalışmaya araştırma konusu olmuştur. Seyrin analizinde, kişi başına düşen tekrarlı ölçüm sayısının dengeli olmaması yaklaşımların uygulanabilmesi açısından önemlidir. Dengeli olmayan veri setlerinde gözlemler, her birey için ortak planlanmış zamanlarda ölçülememiştir. Kayıp verinin nedeni ve araştırma konusu ile ilişkisi modelin geçerliliğini etkileyebilir. Bu nedenle altta yatan kayıp veri mekanizmasının araştırılması gerekmektedir. Bu amaçla bu tez çalışmasında öncelikle zaman aralıkları eşit olmayan dengeli bir veri seti üzerinde sırasıyla; lineer karma model yöntemi ile farklı açıklayıcı etkiler ve farklı varyans-kovaryans matrisi yapılarında rasgele etki modelleri, daha sonra boyuta dayalı otokorelasyon yöntemiyle belirlenmiş varyans-kovaryans yapısında marjinal modeller ve son olarak genelleştirilmiş kestirim eşitlikleri yöntemi ile marjinal modeller kurulmuş, gerçek parametre kestirimleri ve standart hataları belirlenmiştir. Daha sonra karşılaştırma yapmak amacıyla, dengeli veri seti üç farklı kayıp mekanizmasında düzenlenmiş, dengeli olmayan üç yapay veri seti oluşturulmuştur. Üç farklı kayıp mekanizmasında düzenlenmiş dengeli olmayan veri setlerinde analizler sırasıyla tekrarlanırken mevcut verilerin analizi yaklaşımı kullanılmıştır. Böylelikle yöntemlerin farklı kayıp mekanizmalarında oluşturulmuş dengeli olmayan veri setlerinde davranışları, dengeli veri seti ile karşılaştırılmış ve bulguların gerçek parametrelere benzerliği değerlendirilmiştir. Ayrıca mekanizma tümüyle rastlantısal iken dengeli olmayan veri setinde en az bir ölçümü kayıp bireyler çalışma dışında tutularak tam verilerin analizi yaklaşımı da uygulanmış ve bulgular karşılaştırılmıştır. Sonuç olarak uygulanan üç yöntemin dengeli veri seti analizinde, olabilirlik fonksiyonuna dayanan yöntemlerin, kestirimler ve standart hatalarının belirlenmesinde daha yetkin ve kesin olduğu, yarı parametrik yöntem olan genelleştirilmiş kestirim eşitliklerinin daha esnek ve kolay uygulanabilir olduğu tespit edilmiştir. Kayıp veri ile baş etmekte dengeli olmayan veride mekanizma rasgele iken, verinin düzenlenmesi ve standart prosedürlerin geliştirilmesiyle dengeli veri seti ile benzer sonuçlar elde edilmiştir. Ancak kayıp mekanizması rasgele değilken, lineer karma model ve boyuta dayalı otokorelasyon yönteminde uygun modeli seçme aşamaları farklılık göstermiş, bulgular yanlı elde edilmiş, tutarlılık gösterilememiştir. Genelleştirilmiş kestirim eşitlikleri yöntemi ile rasgele olmayan kayıp mekanizmasında geçerli model kurulamamıştır. Son olarak tümüyle rastlantısal kayıp mekanizmasında uygulanan tam verilerin analizinde var olan mevcut bilgi kullanılmamış ve örneklem hacmi düşmüş olduğu için yanlı bulgular elde edilmiştir.

Özet (Çeviri)

Longitudinal studies are designs that involve repeated measurements of the same individuals over a period. They are used in clinical trials to assess the repeated variables' change on average population over time and the covariates' effects on that average change. Unequal number of measurements per subject causes extensive deliberations on the analysis of longitudinal data. The sequences of measurements from units within the study are incomplete, in the sense that intended measurements are not obtained. To handle the resulting unbalanced data structures, reasons for missingness and/or its relation to the research questions need to be considered. In this thesis firstly, for the balanced longitudinal data with irregularly spaced follow-ups, three longitudinal data methodologies were illustrated, i.e. random effects models with linear mixed models (LMM), Gaussian marginal models with spatial autocorrelation (SpA) and marginal models with generalized estimation equations (GEE). Steps of model building and parameter estimations under each model were presented. After figuring out the nature of balanced data; to create missingness, missing data generation scenarios were determined for each missing data mechanisms (MCAR, MAR and MNAR). For comparison purposes, three methodologies were repeated with available case approach onto three artificial incomplete longitudinal data sets. In addition to the available case approach, complete case analysis is also adopted when the missingness mechanism is MCAR. It turns out that for balanced longitudinal data, likelihood-based methods are similar to GEE with almost identical regression coefficients and slightly smaller standard errors. In that sense, GEE is robust against possible misspecification of within subject associations and has a simpler implementation of fitting marginal model. Likelihood-based methods provided parameter estimates with higher precision and are more elaborate in model building. Essential distinction between likelihood-based methods is that mixed models, in particular, use known covariance structure for unbalanced data while Gaussian marginal model with SpA has different classes of covariance structure derived from spatial statistics. When missingness mechanism is random, by means of reconstructing data and/or extending standart procedures, GEE and likelihood-based techniques resulted in parallel results with the ones retrieved from complete balanced data. When missingness mechanism is not random, likelihood-based techniques yielded some discrepancies on model selection steps and yielded biased parameter estimates. GEE analysis cannot be adapted onto MNAR data set. Lastly complete case analysis approach was applied to the data with cases having all measurements. Since this method suffers from loss of information, it resulted in biased estimates due to the reduction in sample size.

Benzer Tezler

  1. Şirketlerde yeniden yapılandırmada kritik performans göstergelerinin oluşturulması: Bir vaka incelemesi

    Creation of critical performance indicators on restructuring in companies: A case study

    BURCU ÇAYIRLI

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    İşletmeBahçeşehir Üniversitesi

    Genel İşletmecilik Ana Bilim Dalı

    PROF. DR. MURAT KASIMOĞLU

  2. İş yaşam dengesinin iş performansına etkisinde çalışmaya tutkunluğun aracı rolü: Hastanelerde bir uygulama

    Mediating role of work engagement in the effect of work-life balance on job performance: An application in hospitals

    SAFİYE ŞAHİN

    Doktora

    Türkçe

    Türkçe

    2016

    HastanelerMarmara Üniversitesi

    İşletme Ana Bilim Dalı

    PROF. DR. UĞUR YOZGAT

  3. Fake news classification using machine learning and deep learning approaches

    Makine öğrenimi ve derin öğrenme yaklaşımlarını kullanarak sahte haber sınıflandırması

    SAJA ABDULHALEEM MAHMOOD AL-OBAIDI

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ TUBA ÇAĞLIKANTAR

  4. Object-aware interactive perception

    Nesne farkındalıklı etkileşimli algılama

    ÇAĞATAY KOÇ

    Doktora

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. SANEM SARIEL UZER

    PROF. DR. SİNAN KALKAN

  5. Uzun süreli verilerin analizinde kullanılan makine öğrenmesi algoritmaları

    Machine learning algorithms for longitudinal data analysis

    CAN DEMİRCİGİL

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    İstatistikHacettepe Üniversitesi

    İstatistik Ana Bilim Dalı

    DOÇ. DR. MELİKE BAHÇECİTAPAR