Veri yapısına bağlı olarak ROC eğrisi altında kalan alana ilişkin istatistiksel yöntemlerin karşılaştırılması
Comparison of statistical methods for the area under the ROC curve for different types of data structures.
- Tez No: 248263
- Danışmanlar: PROF. DR. A. ERGUN KARAAĞAOĞLU
- Tez Türü: Yüksek Lisans
- Konular: Biyoistatistik, Biostatistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2010
- Dil: Türkçe
- Üniversite: Hacettepe Üniversitesi
- Enstitü: Sağlık Bilimleri Enstitüsü
- Ana Bilim Dalı: Biyoistatistik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 56
Özet
Tıpta tanı testlerinin etkinliğinin araştırılmasında ve birden çok tanı testinin karşılaştırılmasında Receiver Operating Characteristic (ROC) analizi sıklıkla uygulanmakta ve ROC eğrisi altında kalan alan (Area Under the ROC Curve, AUCROC ) tanı testlerinin doğruluğunu gösteren bir ölçüt olarak kullanılmaktadır. ROC eğrisi altında kalan alanın elde edilmesine yönelik yöntemler kesin testler ve tanı testlerinin sahip olduğu veri yapısına bağlı olarak değişmektedir. Bu çalışmanın amacı tanı testi ve kesin testin sahip olduğu çeşitli veri yapıları ve dağılımlarında ROC eğrisi altında kalan alanı kestirmeye yönelik parametrik ve parametrik olmayan yöntemlerin hangisinin daha iyi sonuç verdiğini incelemektir. Bu amaçla 3 farklı benzetim çalışması yapılmıştır: i) Aralarında belirli korelasyonlar olan sürekli sonuçlu kesin test ve tanı testi olması durumunda, kesin testi iki sonuçlu hale dönüştürmenin AUC'ler üzerindeki etkileri izlenmiştir. ii) Kesin testin iki sonuçlu olduğu, hasta ve sağlıklılara ilişkin tanı testi sonuçlarının ise sürekli sonuçlu ve normal dağılımlı olduğu durumda parametrik ve parametrik olmayan yöntemle elde edilen AUC'ler karşılaştırılmıştır. iii) Kesin testin iki sonuçlu, hastalara ilişkin tanı testi sonuçlarının sağa çarpık, sağlıklılara ilişkin tanı testi sonuçlarının ise `0' da yığılımlı olduğu durumda parametrik ve parametrik olmayan yönteme dayalı AUC tahminleri karşılaştırılmıştır. Buna göre kesin testi iki biçimli hale dönüştürmede yüksek ve düşük değerler kesim noktası alındığında en büyük alanlara ulaşılmaktadır. Hasta ve sağlıklılara ilişkin tanı testi sonuçlarının her ikisi de normal dağılımlıyken büyük örneklem genişliklerinde parametrik yöntem daha yansız bulunmuş ancak yan değerlerinin çok küçük olmasından dolayı parametrik olmayan yöntemin de kullanılabileceği görülmüştür. Bir noktada yığılımlı verilerde ise Mann Whitney (MW) ve Transformed Normal (TN) yöntemi kullanılarak elde edilen AUC'ler arasında belirgin bir farklılık görülmemiştir.
Özet (Çeviri)
In medical decision making, Receiver Operating Characteristic analysis is frequently used to assess the discrimination ability of diagnostic tests and to make comparisons between two or more diagnostic tests. The Area Under the ROC Curve (AUC) is a useful measurement for interpreting the accuracy of diagnostic tests. The methods for obtaining the AUCROC vary depending on the data structures of gold standard test and diagnostic test. In this study we aimed to compare the methods which are recommended and decide the most appropriate method for the data structure under study. For this purpose we evaluated 3 simulation studies: i) We explored the effect of dichotomizing a continuous gold standard test on AUC while gold standard test has certain correlations with a continuous diagnostic test. ii) We compared the AUCs evaluated by parametric and non-parametric methods while we have a dichotomous gold standard and continuous diagnostic test scores for diseased and healthy patients. iii) We compared the AUCs obtained by parametric and non-parametric approaches while the gold standard is binary and diagnostic test results for diseased are right skewed and spiked at `zero? for healthy patients. According to the findings, using high and low values while dichotomizing the gold standard leads to high AUCs. While the diagnostic test results for both healthy and diseased patients are normally distributed, parametric approach has been found more useful (as it has smaller bias). On the other hand bias values are so close to zero and each other that both parametric and non-parametric methods may be used in such cases. For the spiked data there has been no significant difference between the AUCs obtained by nonparametric Mann Whitney (MW) and parametric Transformed Normal (TN) methods.
Benzer Tezler
- Machine and deep learning based analysis of tumors on FDG-PET images
FDG-PET görüntülerindeki tümörlerin makine ve derin öğrenme tabanlı analizi
OĞUZHAN AYYILDIZ
Doktora
İngilizce
2022
Elektrik ve Elektronik MühendisliğiAbdullah Gül ÜniversitesiElektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. BÜLENT YILMAZ
- Design of seafarer-centric safety system; mental workload (MWL) prediction
Gemi insanı-merkezli emniyet sisteminin tasarımı; mental iş yükü öngörüsü
BARIŞ ÖZSEVER
Doktora
İngilizce
2022
Denizcilikİstanbul Teknik ÜniversitesiDeniz Ulaştırma Mühendisliği Ana Bilim Dalı
PROF. DR. LEYLA TAVACIOĞLU
- Prediction of enzyme classes in a hierarchical approach by using SPMap
SPMap kullanarak enzim sınıflarının hiyerarşik yaklaşımla tahmini
AYŞE GÜL YAMAN
Yüksek Lisans
İngilizce
2009
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. VOLKAN ATALAY
- Kayıp veri içeren veri setlerinde kümeleme uygulamaları
Clustering applications in data sets with missing data
SERPİL SEVİMLİ DENİZ
Doktora
Türkçe
2020
İstatistikVan Yüzüncü Yıl Üniversitesiİstatistik Ana Bilim Dalı
PROF. DR. HALİT ERAY ÇELİK
- Zeki talep tahmin yöntemlerinin doğruluk ve kamçı etkisi açısından değerlendirilmesi: Kimya sektöründe bir uygulama
Evaluation of intelligent forecasting methods in terms of accuracy and bullwhip effect: An application in chemistry sector
FUNDA AHMETOĞLU TAŞDEMİR
Doktora
Türkçe
2012
Endüstri ve Endüstri MühendisliğiYıldız Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. BAHADIR GÜLSÜN