Geri Dön

Diyabet tespitinde makine öğrenmesi algoritmaları yaklaşımını kullanarak yapılmış bir çalışma

A study using the approach of machine learning algorithm in detection of diabetes

  1. Tez No: 723353
  2. Yazar: AYŞE DOĞRU
  3. Danışmanlar: PROF. DR. MURAT ARI, DR. ÖĞR. ÜYESİ SELİM BUYRUKOĞLU
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2021
  8. Dil: Türkçe
  9. Üniversite: Çankırı Karatekin Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik ve Elektronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 128

Özet

Klasik yöntemlerle diyabet hastalığının erken tanı konulmasında ve teşhis edilmesinde kullanılan belirti ve bulgular her zaman yeterli olmayabilir. Bu tez çalışmasında, makine öğrenmesi algoritmalarını kullanarak diyabet hastalığına tanı ve teşhis konulmasında klasik yöntemler dışında farklı bir bakış açısı geliştirilmeye çalışılmıştır. Çalışmada UCI Machine Learning Repository'den temin edilen Early-stage diabetes risk prediction veri kümesi kullanılmıştır. Veri seti 320'si diyabet hastası, 200'ü diyabet hastası olmayan 520 hasta kaydından oluşmaktadır. Hasta profil bilgileri 16 öznitelik ve diyabetli ve diyabetli olmadığını gösteren bir sınıf bilgisinden oluşmaktadır. Veri seti eğitim (%70) ve test (%30) veri seti olmak üzere iki kısma ayrılmıştır. Veri setinden daha iyi performans alabilmek için veri ön işleme adımları uygulanmıştır. Öznitelik seçim tekniklerinden ki-kare yöntemi kullanılarak 9 özellik (Polydipsia, Polyuria, Sudden weight loss, Partial paresis, Gender, Irritability, Polyphagia, Alopecia, Age) seçilmiştir. Doğruluk performansını arttırmak için 10 kat çapraz doğrulama yapılmıştır. Modelimizin sınıflandırma performans kalitesini arttırmak için doğruluk, kesinlik, duyarlılık, F1-skor ve ROC eğrisi doğrulama metrikleri kullanılmıştır. Tez çalışmasındaki amacımız, diyabet hastalığını tahmin edebilmek için tek tabanlı makine öğrenmesi algoritmaları (Lojistik Regresyon, Destek Vektör Makineleri, K-En Yakın Komşu, Naif Bayes ve Yapay Sinir Ağları) ve topluluk makine öğrenmesi (Karar Ağacı, Rastgele Orman, AdaBoost, Gradyan Arttırma, XGBoost, Oylama (Voting), Super Learner) algoritmaları ile doğruluk performanslarını karşılaştırmaktır. En yüksek doğruluk tahmini %99,4 değer ile Super Learner topluluk öğrenme algoritmasıyla elde edilmiştir. Bu çalışmada, Early-stage diabetes risk prediction veri setini kullanarak diyabet hastalığının tahmininde topluluk öğrenmesi algoritmalarının tek tabanlı makine öğrenmesi algoritmalarından daha iyi kabul edilebileceği anlamına gelmektedir. Bu yöntemle hekime yardımcı olması amacıyla diyabet hastalığının erken teşhis edilmesi hedeflenmiştir.

Özet (Çeviri)

The signs and symptoms used in the early detection and diagnosis of diabetes with classical methods may not always be sufficient. In this thesis, it has been tried to develop a different perspective other than classical methods in the detection and diagnosis of diabetes by using machine learning algorithms. The Early-stage diabetes risk prediction dataset obtained from UCI Machine Learning Repository was used in the study. The dataset consists of 520 patient records, 320 of whom are diabetic and 200 are not. The patient profile information consists of 16 attributes and class information indicating diabetic and non-diabetic. The data set is divided into two parts as training (70%) and test (30%) dataset. Data preprocessing steps were applied to get better performance from the dataset. Nine features (Polydipsia, Polyuria, Sudden weight loss, Partial paresis, Gender, Irritability, Polyphagia, Alopecia, Age) were selected using the chi-square method, one of the feature selection techniques. To improve the accuracy performance, 10-fold cross-validation was performed. Accuracy, precision, sensitivity, F1-score, and ROC curve validation metrics were used to improve the classification performance quality of our model. Our aim in the thesis study is to compare the accuracy performances of single-based machine learning algorithms (Logistic Regression, Support Vector Machines, K-Nearest Neighbor, Naive Bayes, and Artificial Neural Networks) and ensemble machine learning algorithms (Decision Trees, Random Forest, AdaBoost, Gradient Boosting, XGBoost Voting, Super Learner) which are used to predict diabetes. The highest accuracy estimate was obtained with the Super Learner ensemble learning algorithm, with a value of 99,4%. This study means that ensemble machine learning algorithms can be considered better than single-based machine learning algorithms in predicting diabetes by using the Early-stage diabetes risk prediction dataset. This method is aimed at early detection of diabetes to assist the clinics.

Benzer Tezler

  1. A hybrid deep learning metaheuristic model for diagnosis of diabetic retinopathy

    Diyabetik retinopatinin tanısı için hibrit bir derin öğrenme meta-sezgisel modeli

    ÖMER FARUK GÜRCAN

    Doktora

    İngilizce

    İngilizce

    2022

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ÖMER FARUK BEYCA

  2. Özellik çıkarma ve DVM tabanlı AdaBoost algoritması ile biyomedikal veri sınıflandırma

    Biomedical data classification with feature extraction and SVM based AdaBoost algorithm

    MÜCAHİD BARSTUĞAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2014

    Elektrik ve Elektronik MühendisliğiSelçuk Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. RAHİME CEYLAN

  3. Diyabetik retinopati teşhisine yönelik yapay zekâ tabanlı karar destek modeli

    An artificial intelligence-based decision support model for diabetic retinopathy diagnosis

    ABDULRAHMAN ÇAVLI

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Bilgi ve Belge YönetimiFırat Üniversitesi

    Teknoloji ve Bilgi Yönetimi Ana Bilim Dalı

    DOÇ. DR. MESUT TOĞAÇAR

  4. Retina görüntülerinin kalite değerlendirmesi ve diyabetik retinopati hastalığının tespiti

    Retinal image quality assessment and detection of diabetic retinopathy disease

    UĞUR ŞEVİK

    Doktora

    Türkçe

    Türkçe

    2014

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKaradeniz Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. CEMAL KÖSE

  5. Sezgisel hibrit öğrenme yöntemleri ile sağlık verilerinin analizi

    Analysis of health data with heuristic hybrid learning methods

    HATİCE NİZAM ÖZOĞUR

    Doktora

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Üniversitesi-Cerrahpaşa

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. ZEYNEP ORMAN