Geri Dön

Hastalık tahmininde makine öğrenmesi sınıflandırma algoritmalarının karşılaştırılması ve bootstrap metodu kullanımı

Comparison of machine learning classification algorithms and using the bootstrap method in disease prediction

  1. Tez No: 771612
  2. Yazar: GAMZE KABA
  3. Danışmanlar: DOÇ. DR. SEDA BAĞDATLI KALKAN
  4. Tez Türü: Yüksek Lisans
  5. Konular: İstatistik, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: Türkçe
  9. Üniversite: İstanbul Ticaret Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 99

Özet

Sağlık alanında uzun yıllarca verilerin kayıt altında tutulması ile büyük veri yığınları oluşmaktadır. Veri yığınları makine öğrenmesi yöntemleri kullanılarak sınıflandırılabilir ve daha anlaşılabilir duruma getirilebilir. Bu yöntemler aynı zamanda birçok hastalık tanısının tahmin edilmesine olanak sağlamaktadır. Bu çalışmada, günümüzde küresel olarak ölüm nedenlerinde birinci sırada yer alan Kardiyovasküler Hastalığın erken teşhisi için çeşitli risk faktörleri değerlendirilmiştir. Hastalığın erken tanısı tedavi sürecini hızlandıracağı için sağlık alanında büyük önem taşımaktadır. Bu çalışmada kullanılan veri seti, Kaggle platformu üzerinden elde edilen,“UCI Machine Learning Repository”veri tabanına ait 5 farklı veri setinden 11 ortak özellik altında birleştirilmiş verilerden oluşmaktadır. Çalışmada makine öğrenmesi sınıflandırma algoritmalarından Naive Bayes, Lojistik Regresyon, Rastgele Orman, K-En Yakın Komşu ve Destek Vektör Makineleri olmak üzere beş farklı sınıflandırma yöntemi kullanılarak, oluşturulan modellerin başarı performansları karşılaştırılmıştır. Bu çalışmada, denetimli makine öğrenmesi algoritmaları kullanılarak kalp hastalığı tahminini en iyi yapabilecek modeli belirlemek amaçlanmıştır. Bireylerde kalp hastalığı olma ihtimalini etkileyebilecek olası risk faktörleri incelenmiştir. Çalışmadaki temel hedeflerden biri sınıflandırma yöntemlerinin güvenilirliğini ve tahminsel doğruluğunu arttırmaktır. Bu amaçla veri setine Bootstrap yeniden örnekleme metodu uygulanmıştır. Kullanılan her bir sınıflandırma yönteminin başarısı ham veri ve örneklemler üzerinde model performans ölçütleri ile karşılaştırılmıştır. En başarılı modeli Rastgele Orman algoritmasının oluşturduğu görülmüştür.

Özet (Çeviri)

In the field of health, large data piles are formed with the recording of data for many years. Data stacks can be classified and made more understandable with using machine learning methods. These methods also allow the estimation of many disease diagnoses. In this study, various of risk factors for early diagnosis of Cardiovascular Disease, which is currently leading couse of death globally, were evaluated. Early diagnosis of the disease carries great importance in the field of health because it accelerates the treatment process. The dataset used in this study, consists of data accumulate under 11 common features from 5 different datasets of the“UCI Machine Learning Repository”database obtained through the Kaggle platform. In this study, the success performances of the models created by using fice different classification methods, namely Naive Bayes, Logistics Regression, Random Forest, K-Nearest Neighbors and Support Vector Machines, which are machine learning classification algorithms, were compared. In this study, it is aimed to determine the model that can best predict heart desease by using supervised machine learning algorithms. Possible risk factors that may affect the probability of having heart disease in individuals were examined. One of the main goals of the study is to increase the reliability and predictive accuracy of the classification methods. For this purpose, Bootstrap resampling method has been applied to the data set. The success of each classificassion method that is used, has been compared with the model performance measures on raw data and samples. It has been seen that the most successful model is the Random Forest algorithm.

Benzer Tezler

  1. Prediction of COVID 19 disease using chest X-ray images based on deep learning

    Derin öğrenmeye dayalı göğüs röntgen görüntüleri kullanarak COVID 19 hastalığının tahmini

    ISMAEL ABDULLAH MOHAMMED AL-RAWE

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. ADEM TEKEREK

  2. Makine öğrenmesi algoritmaları kullanılarak sağlık sisteminde tahmin çalışması

    Prediction study using machine learning algorithms in health system

    GÜLSÜM SALTAN YAŞLI

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Endüstri ve Endüstri MühendisliğiSakarya Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DOÇ. DR. SEHER ARSLANKAYA

  3. Short term electricity load forecasting with deep learning

    Derin öğrenme ile kısa dönemli elektrik yük talep tahmini

    İBRAHİM YAZICI

    Doktora

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ÖMER FARUK BEYCA

  4. Feasibility analysis based on advanced deep learning techniques in integrating renewable energy resources into microgrids

    Yenilenebilir enerji kaynaklarının mikroşebekelere entegre edilmesinde gelişmiş derin öğrenme tekniklerine dayalı uygulanılabilirlik analizi

    FATHI FARAH FADOUL FATHI FARAH FADOUL

    Doktora

    İngilizce

    İngilizce

    2024

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektrik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. RAMAZAN ÇAĞLAR

  5. Train set complexity tunning for imbalance learning

    Dengesiz öğrenme için eğitim seti karmaşıklığının ayarlanması

    MEHMET ULAŞ

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DR. MEHMET ALİ ERGÜN