Geri Dön

Makine öğrenmesi sınıflandırma algoritmaları ile kardiyovasküler hastalıklarının tanı ve tahminleri

The diagnosis and predictions of cardiovascular diseases with machine learning classification algorithms

  1. Tez No: 883630
  2. Yazar: EBRU ÖZTÜRK
  3. Danışmanlar: DOÇ. DR. MUTLU AKAR
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Matematik, Computer Engineering and Computer Science and Control, Mathematics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: Türkçe
  9. Üniversite: Yıldız Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Matematik Ana Bilim Dalı
  12. Bilim Dalı: Matematik Bilim Dalı
  13. Sayfa Sayısı: 58

Özet

Kardiyovasküler hastalık, dünyada en fazla ölüme ve sakatlığa neden olan bulaşıcı olmayan hastalık ölümlerinin %37 sini oluşturmaktadır. Ölüm miktarının büyük bir çoğunluğuna neden olan kardiyovasküler hastalıklar için erken tanı önemli hale gelmektedir. Teknolojinin gelişmesi ile birlikte günümüzde sağlık sektöründe veri miktarı artış göstermiştir. Sağlık sektöründeki bu artan veri miktarı ile makine öğrenmesi tekniklerini kullanarak verilerin sınıflandırılması ve tahmine dayanan analizlerle anlamlı bilgiler çıkarılması kardiyovasküler hastalıkların erken tanısı için önem arz etmektedir. Bu çalışmada 70.000 gerçek hasta verilerinden oluşturulmuş 11 özelliğe sahip veri setinde makine öğrenmesi teknikleri uygulanarak en başarılı sınıflandırma tahmini yapan algoritmaya ulaşıp hastalığın erken teşhisine katkıda bulunulması hedeflenmiştir. İlk olarak veri seti analiz edilerek PCA yöntemi uygulanmıştır. Hangi özelliklerin kardiyovasküler hastalıklara neden olabileceği tespit edilerek özelliklerin karşılaştırmalı olarak görselleştirilmesi sağlanmıştır. Özellik mühendisliği ile hastanın tansiyonu kategorize edilerek normal, yüksek tansiyon, optimal, hipertansiyon olarak sınıflandırılmıştır. Daha sonrasında lojistik regresyon, karar ağacı, rastgele orman, SVM, KNN, XGBoost, gradient boosting, LightGBM, AdaBoost ve ExtraTree yöntemleri kullanılarak kardiyovasküler hastalık tespiti yapılmıştır. XGBoost yönteminin %96.60 doğruluk oranı ile diğer yöntemlere göre daha başarılı olduğu tespit edilmiştir. Bu yöntemi sırasıyla %91.21 doğruluk oranı ile LightGBM ve %90.26 ile ExtraTree takip etmiştir. Sınıflandırma işleminden sonra modelin doğruluğunun gerçeği yansıtıp yansıtmadığını anlamak için karışıklık matrisi kullanılmıştır. Sınıflandırma modelleri başarısını değerlendirme yöntemlerinden biri olan ROC eğrisi ile XGBoost yönteminin doğruluk oranı grafik ile yorumlanmıştır. ROC eğrisinin altında kalan alan olan AUC skoru hesaplanmıştır.

Özet (Çeviri)

Cardiovascular disease constitutes 37% of non-communicable disease deaths, leading to the highest number of deaths and disabilities worldwide. Early diagnosis of cardiovascular diseases, which cause a large majority of deaths, has become important. With the advancement of technology, the amount of data in the health sector has increased today. The classification of data using machine learning techniques and the extraction of meaningful information through predictive analyses with this increasing amount of data in the health sector is important for the early diagnosis of cardiovascular diseases. This study aims to contribute to the early diagnosis of the disease by reaching the most successful classification prediction algorithm applied to a dataset with 11 features created from 70,000 real patient data. Initially, the dataset was analyzed, and the PCA method was applied. It has been determined which features may cause cardiovascular diseases, and the features have been visualized comparatively. With feature engineering, the patient's blood pressure was categorized as normal, high blood pressure, optimal, and hypertension. Subsequently, cardiovascular disease detection was performed using logistic regression, decision tree, random forest, SVM, KNN, XGBoost, gradient boosting, LightGBM, AdaBoost, and ExtraTree methods. The XGBoost method was found to be more successful than other methods with an accuracy rate of 96.60%. This method was followed by LightGBM with an accuracy rate of 91.21% and ExtraTree with 90.26%. After the classification process, a confusion matrix was used to understand whether the model's accuracy reflects reality. The accuracy rate of the XGBoost method has been interpreted graphically with the ROC curve, one of the methods for evaluating the success of classification models. The AUC score, which is the area under the ROC curve, has been calculated.

Benzer Tezler

  1. Kardiyovasküler hastalıklarının teşhisine yönelik makine öğrenmesi algoritmaları ile karar destek sistemi tasarımı

    Decision support system design with machine learning algorithms for the diagnosis of cardiovascular diseases

    AMIR KARAJ

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Bilim ve TeknolojiMarmara Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ZEHRA AYSUN ALTIKARDEŞ

    PROF. DR. ALİ SERDAR FAK

  2. Detection cardiovascular diseases using machine learning algorithms

    Makine öğrenmesi algoritmaları ile kardiyovasküler hastalıkların tahmin edilmesi

    SIMA BEHBUDOVA

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Biyomühendislikİstanbul Üniversitesi-Cerrahpaşa

    Biyomedikal Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ABDURRAHİM AKGÜNDOĞDU

  3. Kalp hastalığı tanısında Weka tabanlı makine öğrenmesi algoritmalarının performans analizi

    Performance analysis of Weka-based machine learning algorithms in heart disease diagnosis

    BEKİR CAN TELKENAROĞLU

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolİZMİR BAKIRÇAY ÜNİVERSİTESİ

    Akıllı Sistemler Mühendisliği Ana Bilim Dalı

    DOÇ. DR. BAHAR DEMİRTÜRK

  4. Normal ve patolojik kalp ses kayıtlarının zaman-frekans temelli otomatik sınıflandırılması

    Time-frequency based automatic classification of normal and pathologic heart saound recordings

    HASAN ZAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    Elektrik ve Elektronik MühendisliğiDicle Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ABDULNASIR YILDIZ

  5. Olasılıksal sembolik motif tanıma

    Probabilistic symbolic pattern recognition

    OĞUZ AKBİLGİÇ

    Doktora

    Türkçe

    Türkçe

    2022

    İstatistikMimar Sinan Güzel Sanatlar Üniversitesi

    İstatistik Ana Bilim Dalı

    PROF. DR. EYLEM DENİZ HOWE