Geri Dön

Risk estimation by maximizing the area under a receiver operating characteristics curve with application to cardiovascular surgery

Receiver operating characteristics (ROC) eğrisi altındaki alanı maksimize ederek risk tahmin yöntemi ve kardiyovasküler cerrahiye uygulaması

  1. Tez No: 268048
  2. Yazar: MURAT KURTCEPHE
  3. Danışmanlar: PROF. DR. H. ALTAY GÜVENİR
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Göğüs Kalp ve Damar Cerrahisi, Computer Engineering and Computer Science and Control, Thoracic and Cardiovascular Surgery
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2010
  8. Dil: İngilizce
  9. Üniversite: İhsan Doğramacı Bilkent Üniversitesi
  10. Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 92

Özet

Risk birçok farklı alanda mevcuttur; tıbbi tanı, finansal piyasalar, dolandırıcılık tespiti ve sigorta poliçeleri bunların birkaçıdır. Çeşitli risk ölçütleri ve risk tahmin sistemleri bugüne kadar önerildi ve bu tez yeni bir risk tahmini yöntemi sunmaktadır. Receiver Operating Characteristics (ROC) eğrisi altındaki alanı maksimize ederek risk tahmin yöntemi (REMARC), risk tahmini bir sıralama sorunu olarak tanımlar. ROC eğrisi altındaki alan (AUC) değeri sıralama kalitesini ölçme ile ilgili olduğundan, REMARC tek bir öznitelik üzerinde en yüksek AUC'yi elde ederek her öznitelik üzerinde mümkün olabilecek en iyi sıralamayı sağlamayı hedeflemetedir. Verilen bir kategorik öznitelik için, herhangi bir risk yordamının en yüksek AUC'yi elde etmek için sağlaması gereken şartın ne olduğunu ispatladık. Sayısal öznitelikler de ölçüt olarak AUC'yi kullanan bir yöntemle ayrıklaştırılmıştır. Sonra, sezgisel bir yaklaşımla AUC'nin maksimize eldilmesi tüm veriseti üzerine genişletilmiştir. REMARC eksik verileri, ikili sınıfları, sürekli ve kategorik öznitelikleri işleyebilir. REMARC yöntemi sadece risk değeri tahmin etmekle kalmaz aynı zamanda her bir öznitelik üzerinde analiz yapar ve karar verme esnasında alan uzmanlarına değerli bilgiler sağlar. REMARC'ın performansı, UCI veriseti deposundan elde edilen birçok veri seti ile support vector machine naïve Bayes, decision trees (karar ağaçları) ve boosting (arttırma) yöntemleri gibi modern algoritmalar kullanılarak değerlendirilmiştir. AUC ölçütüyle yapılan değerlendirmeler göstermektedir ki REMARC diğer birçok makina öğrenmesi yönteminden önemli derecede daha iyi tahmin performansına sahiptir ve diğer yöntemden çoğundan daha hızlı çalışmaktadır.Kardiyovasküler cerrahi alanı, REMARC yöntemi ile yeni risk tahmini çerçevesi oluşturmak amacıyla seçilmiştir. TurkoSCORE projesi, REMARC algoritmasının öğrenme aşaması için veri toplamak amacıyla kullanıldı. REMARC'ın tahmin performansı, en popüler kardiyovasküler cerrahi riski değerlendirme yöntemlerinden biri olan EuroSCORE ile karşılaştırıldı. EuroSCORE Türk hastalar üzerinde değerlendirildi ve EuroSCORE modelinin Türk nüfusü için yeterli olmadığı gösterildi. Sonra, EuroSCORE ve tahmin için REMARC kullanan TurkoSCORE'un tahmin performansı karşılaştırldı. Deneysel değerlendirmeler göstermektedir ki REMARC Türk hasta popülasyonunda EuroSCORE'a göre daha iyi tahmin performansı göstermektedir.

Özet (Çeviri)

Risks exist in many different domains; medical diagnoses, financial markets, fraud detection and insurance policies are some examples. Various risk measures and risk estimation systems have hitherto been proposed and this thesis suggests a new risk estimation method. Risk estimation by maximizing the area under a Receiver Operating Characteristics (ROC) curve (REMARC) defines risk estimation as a ranking problem. Since the area under ROC curve (AUC) is related to measuring the quality of ranking, REMARC aims to maximize the AUC value on a single feature basis to obtain the best ranking possible on each feature. For a given categorical feature, we prove a sufficient condition that any function must satisfy to achieve the maximum AUC. Continuous features are also discretized by a method that uses AUC as a metric. Then, a heuristic is used to extend this maximization to all features of a dataset. REMARC can handle missing data, binary classes and continuous and nominal feature values. The REMARC method does not only estimate a single risk value, but also analyzes each feature and provides valuable information to domain experts for decision making. The performance of REMARC is evaluated with many datasets in the UCI repository by using different state-of-the-art algorithms such as Support Vector Machines, naïve Bayes, decision trees and boosting methods. Evaluations of the AUC metric show REMARC achieves predictive performance significantly better compared with other machine learning classification methods and is also faster than most of them.In order to develop new risk estimation framework by using the REMARC method cardiovascular surgery domain is selected. The TurkoSCORE project is used to collect data for training phase of the REMARC algorithm. The predictive performance of REMARC is compared with one of the most popular cardiovascular surgical risk evaluation method, called EuroSCORE. EuroSCORE is evaluated on Turkish patients and it is shown that EuroSCORE model is insufficient for Turkish population. Then, the predictive performances of EuroSCORE and TurkoSCORE that uses REMARC for prediction are compared. Empirical evaluations show that REMARC achieves better prediction than EuroSCORE on Turkish patient population.

Benzer Tezler

  1. Predicting risk of mortality in patients undergoing cardiovascular surgery

    Kalp ve damar cerrahisinde ölüm riski tahmini

    AYŞEN TUNCA

    Yüksek Lisans

    İngilizce

    İngilizce

    2008

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent Üniversitesi

    Bilgisayar Mühendisliği Bölümü

    PROF. DR. HALİL ALTAY GÜVENİR

  2. Estimating the chance of success and suggestion for treatment in IVF

    Tüp bebek yönteminde tedavi başarı şansını tahmin etme ve tedavi yöntemi önerme

    GİZEM MISIRLI

    Yüksek Lisans

    İngilizce

    İngilizce

    2013

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent Üniversitesi

    Bilgisayar Mühendisliği Bölümü

    PROF. DR. HALİL ALTAY GÜVENİR

  3. Demiryolu ağında trafik sayımlarından O-D matrisi tahmini

    Başlık çevirisi yok

    ZEYNEP AĞCI

    Yüksek Lisans

    Türkçe

    Türkçe

    1998

    İnşaat Mühendisliğiİstanbul Teknik Üniversitesi

    Ulaştırma Ana Bilim Dalı

    PROF. DR. HALUK GERÇEK

  4. Çiftlik hayvanlarında major genler. Bunların belirlenmesi, transferi ve endüstriyel kullanımı

    Major genes in farm animals: Their identification, transfer and industrial utilization

    İBRAHİM CEMAL

    Yüksek Lisans

    Türkçe

    Türkçe

    1996

    ZiraatYüzüncü Yıl Üniversitesi

    Zootekni Ana Bilim Dalı

    DOÇ. DR. ORHAN KARACA