Veri madenciliği yöntemleri kullanılarak yoğun bakım ünitelerinde yatan inme tanılı hastaların mortalite tahmini
Mortality estimation of patients with stroke diagnosed in intensive care units using data mining techniques
- Tez No: 823800
- Danışmanlar: DR. ÖĞR. ÜYESİ KRİSTİN SURPUHİ BENLİ
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: İnme, mortalite tahmini, veri madenciliği yöntemleri, NEU%, LYM%, Stroke, mortality estimation, data mining techniques, NEU%, LYM%
- Yıl: 2023
- Dil: Türkçe
- Üniversite: Üsküdar Üniversitesi
- Enstitü: Sağlık Bilimleri Enstitüsü
- Ana Bilim Dalı: Sağlık Bilişimi Ana Bilim Dalı
- Bilim Dalı: Sağlık Bilişim Sistemleri Bilim Dalı
- Sayfa Sayısı: 53
Özet
Bu tezin amacı veri madenciliği yöntemleri kullanılarak inme tanısı ile yoğun bakım ünitelerinde tedavi gören hastalar için mortalite tahmin modellerinin oluşturulmasıdır. Bu kapsamda Başakşehir Çam Sakura Şehir Hastanesi, Nöroloji Yoğun Bakım ve İnme servislerinde tedavi gören hastalardan elde edilen rutin kan laboratuvar değerlerinden oluşan bir veri seti kullanılmıştır. Veri silme, eksik veri atama ve yeniden örnekleme aşamaları tamamlandıktan sonra NB, J48, RF, MLP, LR, SMO, IBk ve JRip sınıflandırma yöntemleri kullanılarak tahmin modelleri oluşturulmuştur. RF yöntemi, hem ham veri seti ile yapılan deneylerde hem de üç farklı yeniden örnekleme yöntemi ile yeniden örneklenen veri setleri ile gerçekleştirilen deneylerde en yüksek doğruluk, kesinlik, duyarlılık ve F-ölçütü değerlerine ulaşmıştır. Ham veri setindeki doğruluk değeri %86.67 olurken, alt örnekleme ile yeniden örneklenen veri seti ile %84.94, aşırı örnekleme ile yeniden örneklenen veri seti ile %96.11 ve SMOTE ile yeniden örneklenen veri seti ile bu değer %90.09 olmuştur. Veri kümesini temsil edecek en iyi öznitelik alt kümesini belirlemek için CFS, InfoGain ve GainRatio öznitelik seçme yöntemleri kullanılmıştır. CFS yöntemi tarafından belirlenen 35 tane öznitelikten oluşan veri seti ile gerçekleştirilen sınıflandırma deneylerinde %90.09 doğruluk oranı ile RF yöntemi en yüksek performansı göstermiştir. InfoGain ve GainRatio yöntemlerinin bulduğu en yüksek ağırlığa sahip ilk 10 öznitelik kullanılarak gerçekleştirilen sınıflandırma deneylerinde RF yöntemi sırasıyla %87.03 ve %86.31'lik doğruluk oranı ile en başarılı yöntem olmuştur. InfoGain ve GainRatio yöntemleri tarafından belirlenen en yüksek bilgi kazancına sahip öznitelikler NEU%, LYM% ve BAS% parametreleri olmuştur. RF yöntemi bu üç özniteliği içeren veri seti ile %83.96'lık doğruluk oranı elde etmiştir.
Özet (Çeviri)
The aim of this thesis is to create mortality prediction models for patients treated in intensive care units with a diagnosis of stroke using data mining techniques. In this context, a dataset consisting of routine blood laboratory values obtained from patients treated in Başakşehir Çam Sakura City Hospital, Neurology Intensive Care and Stroke Services was used. After data deletion, missing data imputation and resampling stages were completed, prediction models were created with NB, J48, RF, MLP, LR, SMO, IBk and JRip classification methods. The RF method achieved the highest accuracy, precision, sensitivity and F-measure values both in experiments with raw dataset and in experiments with datasets resampled with three different resampling methods. While the accuracy value in the raw dataset was 86.67%, it was 84.94% with the dataset resampled with subsampling, 96.11% with the dataset resampled with oversampling, and 90.09% with the dataset resampled with SMOTE. CFS, InfoGain and GainRatio feature selection methods were used to determine the best feature subset to represent the dataset. In the classification experiments performed with the dataset consisting of 35 features determined by the CFS method, RF method showed the highest performance with an accuracy rate of 90.09%. In the classification experiments performed using the top 10 features with the highest weight found by the InfoGain and GainRatio methods, RF method was the most successful method with an accuracy rate of 87.03% and 86.31%, respectively. The attributes with the highest information gain determined by the InfoGain and GainRatio methods were NEU%, LYM% and BAS%. The RF method achieved an accuracy rate of 83.96% with the dataset containing these three features.
Benzer Tezler
- Yoğun bakım ünitelerinde yatan hastalara ilişkin mortalite ve yatış süresine etki eden faktörlerin veri madenciliği yöntemleri ile incelenmesi
Investigation of factors affecting mortality and length of stay in intensive care units with data mining methods
HÜSEYİN ERKİN SÜLEKLİ
Yüksek Lisans
Türkçe
2019
BiyoistatistikHacettepe ÜniversitesiBiyoistatistik Ana Bilim Dalı
PROF. DR. ERDEM KARABULUT
- Veri madenciliği yöntemleri kullanılarak yoğun bakım hastalarında basamak tespitinin yapılması
Classification of intensive care patients by using data mining methods
EMİNE COŞKUN
Yüksek Lisans
Türkçe
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. MEHMET KAYA
- Çok küçük preterm bebeklerde erken neonatal dönemdeki kan hücre ve indekslerinin morbidite ve mortaliteyi öngörmedeki rolü
Role of early complete blood count parameters to predict morbities and mortality in very preterm babies.
CAN AKYILDIZ
Tıpta Uzmanlık
Türkçe
2019
Çocuk Sağlığı ve HastalıklarıDokuz Eylül ÜniversitesiÇocuk Sağlığı ve Hastalıkları Ana Bilim Dalı
DOÇ. DR. FUNDA TÜZÜN
- Predictive modeling of non-routine maintenance workload in aircraft operations: a task card-level approach using real mro data and machine learning
Uçak bakım operasyonlarında non-routıne iş yükünün öngörüsel modellemesi: gerçek mro verileri ve makine öğrenmesi ile görev kartı düzeyinde bir yaklaşım
TALHA GÜÇLÜ
Yüksek Lisans
İngilizce
2025
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ MEHMET ALİ ERGÜN
- Efficient estimation of Shrinkage parameters in fuzzy Ridge and fuzzy Liu regression models using α-cut-based methods under multicollinearity
Çoklu bağıntı durumunda bulanık Ridge ve bulanık Liu regresyon modellerinde α-kesim tabanlı yöntemler kullanılarak Shrinkage parametrelerinin etkin tahmini
AMMAR HOMAIDA