Bilgilendirici küme boyutuna sahip kümelenmiş verilerin marjinal modellemesi için yeni bir yaklaşım
A new approach for marginal modelling of the clustered data with informative cluster size
- Tez No: 662959
- Danışmanlar: PROF. DR. ZELİHA NAZAN ALPARSLAN
- Tez Türü: Doktora
- Konular: Biyoistatistik, Biostatistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2020
- Dil: Türkçe
- Üniversite: Çukurova Üniversitesi
- Enstitü: Sağlık Bilimleri Enstitüsü
- Ana Bilim Dalı: Biyoistatistik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 84
Özet
Kümelenmiş verilerdeki en önemli özellik, gözlemlerin bilinen kümeler içinde birbirine bağlı olmasıdır. Kümelenmiş veri analizi, hem bireysel düzeydeki faktörlerin hem de küme düzeyindeki faktörlerin sonuç değişkeni üzerindeki etkilerinin incelenmesini sağlar. Kümelenmiş verilerdeki bu etkilerin marjinal modellenmesinde genelleştirilmiş kestirim eşitliği (GEE) kullanılır. Elde edilen sonuç değişkeni ile kümenin büyüklüğü arasındaki bağımlılığı ifade eden bir kavram olan bilgilendirici küme boyutu (ihmal edilemez küme boyutu), kümelenmiş veri yapılarında özel bir durumdur. Bu durumda, marjinal model esas olarak iki farklı yaklaşımla modellenir ve tahminler yapılır. Bu yaklaşımlar, küme-içi yeniden örneklendirme (WCR) ve küme ağırlıklı genelleştirilmiş kestirim eşitliği (CWGEE)'dir. Kayıp veri durumunda kümelenmiş verilerin marjinal modellemesinde ağırlıklı GEE(WGEE) ve iki katlı robust GEE(DR-GEE) yaklaşımları kullanılır. WGEE yaklaşımının bir adımı olan ters olasılık ağırlığı küme boyutuna göre ifade edildiğinde CWGEE yaklaşımı WGEE yaklaşımının özel bir formu olarak tanımlanmış olur. Bu çalışmada, DR-GEE yaklaşımının WGEE yaklaşımına alternatif olmasına dayanarak DR-GEE yaklaşımının, CWGEE için de alternatif bir yaklaşım olabileceği varsayımı ile yola çıkılmıştır. DR-GEE yaklaşımının küme boyutuna göre ağırlıklandırılması için iki farklı yöntem önerilmiştir. Amaç, çalışmada önerilmiş olan DR-GEE(1) ve DR-GEE(2) yöntemlerinin mevcut yaklaşımlarla karşılaştırılmasıdır. Gerçek veri seti olarak periodontal hastalık varlığına neden olan faktörleri 6 açıklayıcı değişken ile belirlemek amacıyla 206 bireyin dahil edildiği bir çalışmanın verileri kullanılmıştır. Simülasyon çalışması ise tek açıklayıcı değişken içerecek şekilde tasarlanmış ve farklı örneklem büyüklüklerinde (50, 100, 200 ve 500), farklı küme büyüklüklerinde (10, 20 ve 50) 100 tekrarlı simüle edilmiş verilerle parametre tahminleri elde edilmiştir. Parametre tahminleri öncelikle GEE, WCR ve CWGEE yaklaşımı ile değerlendirilmiş, daha sonra çalışmanın amacına yönelik olarak yeni önerilen çıkarsama yöntemlerine (DR-GEE(1) ve DR-GEE(2)) ilişkin değerlendirmeler yapılmıştır. Mevcut üç ve önerilen iki çıkarsama yaklaşımının karşılaştırılması sonucunda; GEE, yanlılık bakımından en düşük performansa sahip olan yaklaşımdır. Bilgilendirici küme boyutu literatüründe önerilen CWGEE yaklaşımı, en iyi performansa sahip olan yaklaşım iken WCR yaklaşımı, performans bakımından GEE ve CWGEE yaklaşımlarının arasında yer almıştır. Tez kapsamında ikinci önerilen yöntem olan DR-GEE(2) yaklaşımının, yüksek küme büyüklüğü ve küme sayısı senaryolarında yanlılık bakımından en iyi performansa sahip olduğu, CWGEE ve WCR yaklaşımlarına alternatif olarak kullanılabileceği ortaya konmuştur.
Özet (Çeviri)
The most important feature of clustered data is that the observations are correlated within clusters. Clustered data analysis allows the analysis of the effects of both individual-level and cluster-level factors on the outcome variable and generalized estimation equation (GEE) is used in the marginal modeling of these effects. The informative cluster size (the non-ignorable cluster size), a concept that expresses the dependence between the outcome variable and the size of the cluster, is a special case in the clustered data structures. In this case, the marginal model is essentially fitted and predictions are performed with two different approaches: within-cluster resampling (WCR) and cluster weighted generalized estimating equations (CWGEE). Weighted GEE (WGEE) and doubly robust GEE (DR-GEE) approaches are used in marginal modeling of clustered data with missing values. CWGEE is defined as a special form of the WGEE approach, in which the inverse probability weighting, a step of the WGEE approach, is stated in terms of cluster size. This study, starting out with the fact that DR-GEE approach is an alternative to the WGEE approach, considers that some form of the DR-GEE approach can be an alternative approach for CWGEE. Two different methods(named DRGEE(1) and DRGEE(2)) are proposed for weighting the DR-GEEapproach with regards to the cluster size. The aim is to compare the newly proposed DR-GEE(1) and DR-GEE(2) methods with the current approaches. Real data from a study including 206 individuals were used to determine the factors that cause periodontal disease. The presence of periodontal disease is modeled by 6 explanatory variables. The simulation study was designed to include a single explanatory variable and parameter estimates were obtained with simulated data of different sample sizes (50, 100, 200 and 500) and different cluster sizes (10, 20 and 50) with 100 replications. Parameter estimations were initially obtained by GEE, WCR and CWGEE approaches, and then, analysis using the proposed inference methods (DR-GEE (1) and DR-GEE(2)) and the results obtained by four methods were compared. As a result of comparing the three existing and two proposed inference approaches; GEE is the worst performing approach in terms of bias. While the CWGEE approach suggested in the informative cluster size literature has the best performance, the WCR approach is performing between the GEE and CWGEE. It was revealed that the DR-GEE(2) approach, the second proposed method within the scope of the thesis, has the best performance in terms of bias in high cluster size and cluster number scenarios and can be used as an alternative to CWGEE and WCR approaches.
Benzer Tezler
- Küme kavramına ilişkin öğrenci, öğretmen algısı ve ders kitaplarında küme kavramının ele alınış biçimi
Students? and teachers? perceptions of concept of sets and the way it is covered in the textbooks
GÖKHAN DEMİR
Yüksek Lisans
Türkçe
2012
Eğitim ve ÖğretimGaziantep Üniversitesiİlköğretim Ana Bilim Dalı
YRD. DOÇ. DR. ERHAN BİNGÖLBALİ
- İlkokul birinci sınıf matematik ders kitaplarında bulunan görsellerin biçim ve içerik açısından incelenmesi
An analysis on the visuals in the primary school first grade mathematics textbooks in terms of form and content
GUNAY BAGHIRLI
Yüksek Lisans
Türkçe
2020
Eğitim ve ÖğretimNecmettin Erbakan Üniversitesiİlköğretim Eğitimi Ana Bilim Dalı
DOÇ. DR. BEYHAN NAZLI KOÇBEKER EİD
- Developing a school based professional development program for improving technological skills and andragogical knowledge of teachers in private night high schools
Özel akşam lisesi öğretmenlerinin andragojik bilgilerini ve teknolojik becerilerini geliştirmek için okul temelli mesleki gelişim programı geliştirme
AFRA NUR AKSOY
Doktora
İngilizce
2018
Eğitim ve ÖğretimOrta Doğu Teknik ÜniversitesiEğitim Bilimleri Ana Bilim Dalı
PROF. DR. MERAL AKSU
- Okul yöneticilerinin okul şiddetine ve güvenliğine ilişkin görüşleri
Principals' perception on school bullying and safety
İPEK AĞBAHT UZUN
Yüksek Lisans
Türkçe
2018
Eğitim ve ÖğretimÇukurova ÜniversitesiSınıf Öğretmenliği Ana Bilim Dalı
PROF. DR. FİLİZ YURTAL
- Investigation of genetic diversity, phylogenetic and chemotaxonomic relationships in some opium poppy (papaver somniferum l.) cultivars in Turkey
Türkiye'deki bazı haşhaş (papaver somniferum l.) kültür varyetelerinde genetik çeşitlilik, kemotaksonomik ve filogenetik ilişkilerin araştırılması
UĞUR ŞEN
Doktora
İngilizce
2017
BiyolojiMarmara ÜniversitesiBiyoloji Ana Bilim Dalı
PROF. DR. İBRAHİM İLKER ÖZYİĞİT
DOÇ. DR. ERTUĞRUL FİLİZ