Geri Dön

Kümelenmiş veri analizi ve sağlık alanında bir uygulama

Clustered data analysis and an application in health sciences

  1. Tez No: 473842
  2. Yazar: KÜBRA ELİF AKBAŞ
  3. Danışmanlar: YRD. DOÇ. HARİKA GÖZDE GÖZÜKARA BAĞ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Biyoistatistik, Biostatistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2017
  8. Dil: Türkçe
  9. Üniversite: İnönü Üniversitesi
  10. Enstitü: Sağlık Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Biyoistatistik ve Tıbbi Bilişim Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 57

Özet

Amaç: Sağlık alanında yapılan çalışmalarda sıklıkla kümelenmiş veri yapısı karşımıza çıkabilmektedir. Kümelenmiş verileri diğer verilerden ayıran en önemli özelliği aynı kümeden elde edilen sonuçların birbiriyle ilişkili olmasıdır. Bu korelasyon yapısının göz ardı edilmesi ise istatistiksel çıkarımda yanlılığa neden olabilir. Bu çalışmanın amacı, kümelenmiş veriler için korelasyon yapısını dikkate alan alternatif yöntemleri tanıtmak ve sağlık alanında bir veri üzerinde uygulamasını göstermektir. Böylece kümelenmiş verilere uygulanan standart istatistiksel analiz yöntemlerinin yanlı sonuç verebileceği ve doğru analiz yöntemi ile geçerli bulgular elde edilebileceği örneklenecektir. Materyal ve Metot: Standart ki-kare testi ile önerilen düzeltilmiş testlerin karşılaştırılması ve örneklenmesi amacıyla hipotetik bir sağlık verisi kullanılmıştır. Bu verinin analiz edilmesinde ise standart Pearson ki-kare testi ve kümelenmiş kategorik veriler için önerilen Rosner (1982) düzeltilmiş ki-kare (1), Dallal (1988) düzeltilmiş ki-kare (2). Donner (1989) düzeltilmiş ki-kare (3) ve Rao ve Scott (1992) düzeltilmiş ki-kare (4) testleri kullanılmıştır. Bulgular: Her bir hastanın iki gözü üzerinde yapılan ölçüm sonucunda katarakt varlığı değerlendirilmiştir. Yaş gruplarına göre pozitiflik oranları karşılaştırılmak istenmektedir. Rosner düzeltilmiş ki-kare test istatistiği T=9.04; p=0.010, Dallal düzeltilmiş ki-kare test istatistiği D=8.27; p=0.040, Donner düzeltilmiş ki-kare istatistiği 〖X_A〗^2=9.12; p=0.010 ve Rao ve Scott düzeltilmiş ki-kare test istatistiği (X^2 ) ̃=8.9; p=0.011 olarak elde edilmiştir. Ayrıca standart ki-kare test istatistiği X^2=9.2; p=0.055 olarak bulunmuştur. Sonuç: Kümelenmiş veri yapısını dikkate alan düzeltilmiş test istatistikleri ile H0 hipotezi reddedilirken, standart ki-kare testi ile H0 hipotezi kabul edilmiştir. Veri yapısına uygun olmayan istatistiksel yöntemlerin kullanılması yanlış sonuçlara ulaşılmasına neden olabilir.

Özet (Çeviri)

Aim: Clustered data structure can be confronted frequently in health field studies. The most important feature that distinguishes clustered data from other data is that the results from the same cluster are related to each other. Ignoring this correlation structure may lead to bias in statistical inference. The aim of this study is to introduce alternative methods that take into account the correlation structure for clustered data and demonstrate its application on a data in the field of health. Thus, it will be illustrated that the standard statistical analysis methods applied to the clustered datasets may yield biased results and valid findings can be obtained with the correct analysis method. Material and Method: For the comparison and illustration of the standard chi-square test and the adjusted tests a hypothetical health data was used. This data was analyzed with proposed methods for clustered categorical data which are Rosner (1982) adjusted chi-square (1), Dallal (1988) adjusted chi-square (2), Donner (1989) adjusted chi-square (3) and Rao and Scott (1992) adjusted chi-square (4) test and standard Pearson chi-square test. Results: The presence of cataract was assessed as the result of measurement on two eyes of each patient. It is aimed to compare the positivity rates according to age groups. The results of the test statistics were obtained as T = 9.04; p = 0.010 for Rosner adjusted chi-square test statistic, D = 8.27; p = 0.040 for Dallal adjusted chi-square test statistic, 〖X_A〗^2 = 9.12; p = 0.010 for Donner adjusted chi-square statistic and (X^2 ) ̃ = 8.9; p=0.011 for Rao and Scott adjusted chi-square test statistic. The other applied method standard Pearson chi-square test statistic was obtained as 𝑋2 = 9.2; p = 0.055. Conclusion: While the H0 hypothesis was rejected by the adjusted test statistics taking into account the clustered data structure, the H0 hypothesis was accepted by the standard chi-square test. Using statistical methods that are not suitable for data structure may lead to wrong results.

Benzer Tezler

  1. İnteraktif makine öğrenmesi kullanılarak, aktör-metâ ilişkisinin analizi ile sağlık geri ödeme sistemlerinde proaktif suistimal tespiti modeli

    An interactive machine-learning-based electronic fraud and abuse detection system in healthcare insurance

    İLKER KÖSE

    Doktora

    Türkçe

    Türkçe

    2015

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGebze Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. MEHMET GÖKTÜRK

  2. Derin öğrenmeye dayalı olarak yeni nesil dizileme verilerinin kümelenmesi

    Clustering next generation sequencing data based on deep learning

    UĞUR TOPRAK

    Doktora

    Türkçe

    Türkçe

    2022

    BiyoistatistikAnkara Üniversitesi

    Biyoistatistik Ana Bilim Dalı

    DOÇ. DR. BEYZA DOĞANAY ERDOĞAN

  3. RNA-dizileme verilerinin kümelenmesinde yeni istatistiksel yaklaşımlar

    Novel statistical approaches in clustering RNA-sequencing data

    AHU DURMUŞÇELEBİ

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    BiyoistatistikErciyes Üniversitesi

    Biyoistatistik Ana Bilim Dalı

    DOÇ. DR. GÖKMEN ZARARSIZ

  4. Uzunlamasına çalışmaların analizinde karma etki modelleri

    Mixed effects models for analyzing longitudinal studies

    BEYZA DOĞANAY

    Yüksek Lisans

    Türkçe

    Türkçe

    2007

    BiyoistatistikAnkara Üniversitesi

    Biyoistatistik Ana Bilim Dalı

    Y.DOÇ.DR. S. KENAN KÖSE

  5. Kohonen öz örgütlemeli haritalama yöntemi ile psikotik hastalıkların kümelenmesi

    Kohonen cluster of psychotic diseases by self organizing mapping method

    ASLI ÇİFTCİ

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    BiyoistatistikHacettepe Üniversitesi

    Biyoistatistik Bilim Dalı

    DR. ÖĞR. ÜYESİ SEVİLAY KARAHAN