Geri Dön

Veri madenciliği yöntemleri kullanılarak yoğun bakım ünitelerinde yatan inme tanılı hastaların mortalite tahmini

Mortality estimation of patients with stroke diagnosed in intensive care units using data mining techniques

  1. Tez No: 823800
  2. Yazar: ÜMMÜHAN ÇAKIR SAĞÇOLAK
  3. Danışmanlar: DR. ÖĞR. ÜYESİ KRİSTİN SURPUHİ BENLİ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: İnme, mortalite tahmini, veri madenciliği yöntemleri, NEU%, LYM%, Stroke, mortality estimation, data mining techniques, NEU%, LYM%
  7. Yıl: 2023
  8. Dil: Türkçe
  9. Üniversite: Üsküdar Üniversitesi
  10. Enstitü: Sağlık Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Sağlık Bilişimi Ana Bilim Dalı
  12. Bilim Dalı: Sağlık Bilişim Sistemleri Bilim Dalı
  13. Sayfa Sayısı: 53

Özet

Bu tezin amacı veri madenciliği yöntemleri kullanılarak inme tanısı ile yoğun bakım ünitelerinde tedavi gören hastalar için mortalite tahmin modellerinin oluşturulmasıdır. Bu kapsamda Başakşehir Çam Sakura Şehir Hastanesi, Nöroloji Yoğun Bakım ve İnme servislerinde tedavi gören hastalardan elde edilen rutin kan laboratuvar değerlerinden oluşan bir veri seti kullanılmıştır. Veri silme, eksik veri atama ve yeniden örnekleme aşamaları tamamlandıktan sonra NB, J48, RF, MLP, LR, SMO, IBk ve JRip sınıflandırma yöntemleri kullanılarak tahmin modelleri oluşturulmuştur. RF yöntemi, hem ham veri seti ile yapılan deneylerde hem de üç farklı yeniden örnekleme yöntemi ile yeniden örneklenen veri setleri ile gerçekleştirilen deneylerde en yüksek doğruluk, kesinlik, duyarlılık ve F-ölçütü değerlerine ulaşmıştır. Ham veri setindeki doğruluk değeri %86.67 olurken, alt örnekleme ile yeniden örneklenen veri seti ile %84.94, aşırı örnekleme ile yeniden örneklenen veri seti ile %96.11 ve SMOTE ile yeniden örneklenen veri seti ile bu değer %90.09 olmuştur. Veri kümesini temsil edecek en iyi öznitelik alt kümesini belirlemek için CFS, InfoGain ve GainRatio öznitelik seçme yöntemleri kullanılmıştır. CFS yöntemi tarafından belirlenen 35 tane öznitelikten oluşan veri seti ile gerçekleştirilen sınıflandırma deneylerinde %90.09 doğruluk oranı ile RF yöntemi en yüksek performansı göstermiştir. InfoGain ve GainRatio yöntemlerinin bulduğu en yüksek ağırlığa sahip ilk 10 öznitelik kullanılarak gerçekleştirilen sınıflandırma deneylerinde RF yöntemi sırasıyla %87.03 ve %86.31'lik doğruluk oranı ile en başarılı yöntem olmuştur. InfoGain ve GainRatio yöntemleri tarafından belirlenen en yüksek bilgi kazancına sahip öznitelikler NEU%, LYM% ve BAS% parametreleri olmuştur. RF yöntemi bu üç özniteliği içeren veri seti ile %83.96'lık doğruluk oranı elde etmiştir.

Özet (Çeviri)

The aim of this thesis is to create mortality prediction models for patients treated in intensive care units with a diagnosis of stroke using data mining techniques. In this context, a dataset consisting of routine blood laboratory values obtained from patients treated in Başakşehir Çam Sakura City Hospital, Neurology Intensive Care and Stroke Services was used. After data deletion, missing data imputation and resampling stages were completed, prediction models were created with NB, J48, RF, MLP, LR, SMO, IBk and JRip classification methods. The RF method achieved the highest accuracy, precision, sensitivity and F-measure values both in experiments with raw dataset and in experiments with datasets resampled with three different resampling methods. While the accuracy value in the raw dataset was 86.67%, it was 84.94% with the dataset resampled with subsampling, 96.11% with the dataset resampled with oversampling, and 90.09% with the dataset resampled with SMOTE. CFS, InfoGain and GainRatio feature selection methods were used to determine the best feature subset to represent the dataset. In the classification experiments performed with the dataset consisting of 35 features determined by the CFS method, RF method showed the highest performance with an accuracy rate of 90.09%. In the classification experiments performed using the top 10 features with the highest weight found by the InfoGain and GainRatio methods, RF method was the most successful method with an accuracy rate of 87.03% and 86.31%, respectively. The attributes with the highest information gain determined by the InfoGain and GainRatio methods were NEU%, LYM% and BAS%. The RF method achieved an accuracy rate of 83.96% with the dataset containing these three features.

Benzer Tezler

  1. Yoğun bakım ünitelerinde yatan hastalara ilişkin mortalite ve yatış süresine etki eden faktörlerin veri madenciliği yöntemleri ile incelenmesi

    Investigation of factors affecting mortality and length of stay in intensive care units with data mining methods

    HÜSEYİN ERKİN SÜLEKLİ

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    BiyoistatistikHacettepe Üniversitesi

    Biyoistatistik Ana Bilim Dalı

    PROF. DR. ERDEM KARABULUT

  2. Veri madenciliği yöntemleri kullanılarak yoğun bakım hastalarında basamak tespitinin yapılması

    Classification of intensive care patients by using data mining methods

    EMİNE COŞKUN

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. MEHMET KAYA

  3. Çok küçük preterm bebeklerde erken neonatal dönemdeki kan hücre ve indekslerinin morbidite ve mortaliteyi öngörmedeki rolü

    Role of early complete blood count parameters to predict morbities and mortality in very preterm babies.

    CAN AKYILDIZ

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2019

    Çocuk Sağlığı ve HastalıklarıDokuz Eylül Üniversitesi

    Çocuk Sağlığı ve Hastalıkları Ana Bilim Dalı

    DOÇ. DR. FUNDA TÜZÜN

  4. Evaluation des performances des projets de l'affaire électronique basé sur GRC en utilisant le tableau de bord équilibré et management de capital client

    CRM bazlı e-iş proje performanslarının dengelenmiş skorkartı ve entelektüel müşteri sermayesi yönetimi ile değerlendirilmesi

    BURHAN BURÇ KILIÇER

    Yüksek Lisans

    Fransızca

    Fransızca

    2004

    Endüstri ve Endüstri MühendisliğiGalatasaray Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    PROF.DR. ETHEM TOLGA

  5. Türkçe için sahte haber tespit modelinin oluşturulması

    A fake news detection model for Turkish language

    UĞUR MERTOĞLU

    Doktora

    Türkçe

    Türkçe

    2020

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ BURKAY GENÇ

    PROF. DR. HAYRİ SEVER