Geri Dön

Makine öğrenmesi algoritmaları kullanılarak diyabetin erken teşhisi ve performans karşılaştırması

Early diagnosis of diabetes using machine learning algorithms andperformance comparison

  1. Tez No: 922396
  2. Yazar: ALMİLA SU SALİN
  3. Danışmanlar: PROF. DR. ARAL EGE
  4. Tez Türü: Yüksek Lisans
  5. Konular: Yönetim Bilişim Sistemleri, Management Information Systems
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2025
  8. Dil: Türkçe
  9. Üniversite: Ufuk Üniversitesi
  10. Enstitü: Sosyal Bilimler Enstitüsü
  11. Ana Bilim Dalı: Yönetim Bilişim Sistemleri Ana Bilim Dalı
  12. Bilim Dalı: Yönetim Bilişim Sistemleri Bilim Dalı
  13. Sayfa Sayısı: 83

Özet

Diyabet, dünya genelinde yaygın bir kronik hastalık olup, erken teşhis edilmediğinde ciddi sağlık komplikasyonlarına yol açabilmektedir. Bu çalışma, diyabet hastalığının erken evrede tahmin edilmesi amacıyla, makine öğrenimi algoritmalarının performansını karşılaştırmalı olarak değerlendirmeyi amaçlamaktadır. Çalışmada kullanılan veri seti, UCI Machine Learning Repository (Dua, D., Graff, C., 2019.) açık veri seti kullanılarak Bangladeş'in Sylhet Diyabet Hastanesi'nden (Islam vd., 2020) elde edilmiş olup 520 hastaya ait 16 öznitelik içermektedir. Veri setinde 320 diyabet pozitif ve 200 diyabet negatif hasta verisi bulunmaktadır. Veri ön işleme sürecinde eksik veri kontrolü yapılmış, sayısal veriler ölçeklendirilmiş ve sınıf dengesizliği SMOTE yöntemi ile düzeltilmiştir. Makine öğrenim algoritmalarından, Karar Ağaçları, k-En Yakın Komşuluk (k-NN), Lojistik Regresyon, Naive Bayes ve Rastgele Orman algoritmaları kullanılmıştır. Modellerin performansı, doğruluk (accuracy), F1 skoru ve ROC-AUC gibi ölçütler kullanılarak değerlendirilmiştir. Elde edilen sonuçlara göre, k-NN modeli, optimize edilmiş hiperparametrelerle %89.7 doğruluk, 0.91 F1 skoru ve 0.90 ROC-AUC skoru ile en iyi performansı göstermiştir. Rastgele Orman modeli de güçlü bir alternatif olarak %87.5 doğruluk ve 0.88 ROC-AUC değeri elde etmiştir. Karışıklık matrisi analizinde, modelin yanlış pozitif ve yanlış negatif oranlarının düşük olduğu gözlemlenmiştir. Elde edilen sonuçlar, makine öğrenimi algoritmalarının diyabetin erken teşhisinde etkili bir araç olduğunu göstermektedir. Özellikle k-NN modeli, küçük veri setlerinde güçlü performans sergilemiştir. Bu çalışma, gelecekte daha büyük ve çeşitli veri setleri ile yapılan araştırmalar için bir temel oluşturmakta ve diyabet teşhisinde teknolojik çözümlerin önemini vurgulamaktadır.

Özet (Çeviri)

Diabetes is a globally prevalent chronic disease that, if not diagnosed early, can lead to severe health complications. This study aims to comparatively evaluate the performance of machine learning algorithms for predicting early-stage diabetes. The dataset used in this study was obtained from the UCI Machine Learning Repository (Dua, D., Graff, C., 2019) and was originally collected at the Sylhet Diabetes Hospital in Bangladesh (Islam et al., 2020). The dataset contains 16 attributes from 520 patients and comprises 320 diabetes-positive and 200 diabetes-negative records. During the data preprocessing phase, missing values were addressed, numerical data were scaled, and class imbalance was corrected using the SMOTE method. The machine learning algorithms used in this study include Decision Trees, k-Nearest Neighbors (k-NN), Logistic Regression, Naive Bayes, and Random Forest. The performance of these models was evaluated based on metrics such as accuracy, F1 score, and ROC-AUC. The results indicate that the k-NN algorithm, with optimized hyperparameters, achieved the highest performance, reaching 89.7% accuracy, an F1 score of 0.91, and a ROC-AUC score of 0.90. The Random Forest algorithm also showed strong performance, attaining 87.5% accuracy and a ROC-AUC score of 0.88. An analysis of the confusion matrix revealed low false positive and false negative rates for these models. These findings demonstrate that machine learning algorithms are effective tools for early diabetes prediction. Larger datasets and improved algorithms could further strengthen these results. This study provides a foundation for integrating machine learning models into mobile applications or clinical decision support systems and underscores the importance of technological solutions in diabetes diagnosis, with the aim of enhancing early diagnosis, treatment planning, reducing healthcare costs, and contributing to public health outcomes.

Benzer Tezler

  1. XGboost ve karar ağacı tabanlı algoritmaların diyabet veri setleri üzerine uygulaması

    Application of XGboost and decision tree based algorithms on diabetes data

    GÜLÇİN YANGIN

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    İstatistikMimar Sinan Güzel Sanatlar Üniversitesi

    İstatistik Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ELİF ÖZGE ÖZDAMAR

  2. Makine öğrenmesi teknikleri ile sağlık davranışlarına dayalı diyabetin tahmin edilmesi

    Predicting of the diabetes based on health behavior with machine learning techniques

    HAITHM FADHL MOHAMMED AL-SHARI

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEskişehir Osmangazi Üniversitesi

    Matematik ve Bilgisayar Bilimleri Ana Bilim Dalı

    DOÇ. DR. ALPER ODABAŞ

  3. A hybrid deep learning metaheuristic model for diagnosis of diabetic retinopathy

    Diyabetik retinopatinin tanısı için hibrit bir derin öğrenme meta-sezgisel modeli

    ÖMER FARUK GÜRCAN

    Doktora

    İngilizce

    İngilizce

    2022

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ÖMER FARUK BEYCA

  4. Diyabet tespitinde makine öğrenmesi algoritmaları yaklaşımını kullanarak yapılmış bir çalışma

    A study using the approach of machine learning algorithm in detection of diabetes

    AYŞE DOĞRU

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÇankırı Karatekin Üniversitesi

    Elektrik ve Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. MURAT ARI

    DR. ÖĞR. ÜYESİ SELİM BUYRUKOĞLU

  5. Diyabetik retinopati teşhisine yönelik yapay zekâ tabanlı karar destek modeli

    An artificial intelligence-based decision support model for diabetic retinopathy diagnosis

    ABDULRAHMAN ÇAVLI

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Bilgi ve Belge YönetimiFırat Üniversitesi

    Teknoloji ve Bilgi Yönetimi Ana Bilim Dalı

    DOÇ. DR. MESUT TOĞAÇAR