Diyabet tespitinde makine öğrenmesi algoritmaları yaklaşımını kullanarak yapılmış bir çalışma
A study using the approach of machine learning algorithm in detection of diabetes
- Tez No: 723353
- Danışmanlar: PROF. DR. MURAT ARI, DR. ÖĞR. ÜYESİ SELİM BUYRUKOĞLU
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2021
- Dil: Türkçe
- Üniversite: Çankırı Karatekin Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektrik ve Elektronik Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 128
Özet
Klasik yöntemlerle diyabet hastalığının erken tanı konulmasında ve teşhis edilmesinde kullanılan belirti ve bulgular her zaman yeterli olmayabilir. Bu tez çalışmasında, makine öğrenmesi algoritmalarını kullanarak diyabet hastalığına tanı ve teşhis konulmasında klasik yöntemler dışında farklı bir bakış açısı geliştirilmeye çalışılmıştır. Çalışmada UCI Machine Learning Repository'den temin edilen Early-stage diabetes risk prediction veri kümesi kullanılmıştır. Veri seti 320'si diyabet hastası, 200'ü diyabet hastası olmayan 520 hasta kaydından oluşmaktadır. Hasta profil bilgileri 16 öznitelik ve diyabetli ve diyabetli olmadığını gösteren bir sınıf bilgisinden oluşmaktadır. Veri seti eğitim (%70) ve test (%30) veri seti olmak üzere iki kısma ayrılmıştır. Veri setinden daha iyi performans alabilmek için veri ön işleme adımları uygulanmıştır. Öznitelik seçim tekniklerinden ki-kare yöntemi kullanılarak 9 özellik (Polydipsia, Polyuria, Sudden weight loss, Partial paresis, Gender, Irritability, Polyphagia, Alopecia, Age) seçilmiştir. Doğruluk performansını arttırmak için 10 kat çapraz doğrulama yapılmıştır. Modelimizin sınıflandırma performans kalitesini arttırmak için doğruluk, kesinlik, duyarlılık, F1-skor ve ROC eğrisi doğrulama metrikleri kullanılmıştır. Tez çalışmasındaki amacımız, diyabet hastalığını tahmin edebilmek için tek tabanlı makine öğrenmesi algoritmaları (Lojistik Regresyon, Destek Vektör Makineleri, K-En Yakın Komşu, Naif Bayes ve Yapay Sinir Ağları) ve topluluk makine öğrenmesi (Karar Ağacı, Rastgele Orman, AdaBoost, Gradyan Arttırma, XGBoost, Oylama (Voting), Super Learner) algoritmaları ile doğruluk performanslarını karşılaştırmaktır. En yüksek doğruluk tahmini %99,4 değer ile Super Learner topluluk öğrenme algoritmasıyla elde edilmiştir. Bu çalışmada, Early-stage diabetes risk prediction veri setini kullanarak diyabet hastalığının tahmininde topluluk öğrenmesi algoritmalarının tek tabanlı makine öğrenmesi algoritmalarından daha iyi kabul edilebileceği anlamına gelmektedir. Bu yöntemle hekime yardımcı olması amacıyla diyabet hastalığının erken teşhis edilmesi hedeflenmiştir.
Özet (Çeviri)
The signs and symptoms used in the early detection and diagnosis of diabetes with classical methods may not always be sufficient. In this thesis, it has been tried to develop a different perspective other than classical methods in the detection and diagnosis of diabetes by using machine learning algorithms. The Early-stage diabetes risk prediction dataset obtained from UCI Machine Learning Repository was used in the study. The dataset consists of 520 patient records, 320 of whom are diabetic and 200 are not. The patient profile information consists of 16 attributes and class information indicating diabetic and non-diabetic. The data set is divided into two parts as training (70%) and test (30%) dataset. Data preprocessing steps were applied to get better performance from the dataset. Nine features (Polydipsia, Polyuria, Sudden weight loss, Partial paresis, Gender, Irritability, Polyphagia, Alopecia, Age) were selected using the chi-square method, one of the feature selection techniques. To improve the accuracy performance, 10-fold cross-validation was performed. Accuracy, precision, sensitivity, F1-score, and ROC curve validation metrics were used to improve the classification performance quality of our model. Our aim in the thesis study is to compare the accuracy performances of single-based machine learning algorithms (Logistic Regression, Support Vector Machines, K-Nearest Neighbor, Naive Bayes, and Artificial Neural Networks) and ensemble machine learning algorithms (Decision Trees, Random Forest, AdaBoost, Gradient Boosting, XGBoost Voting, Super Learner) which are used to predict diabetes. The highest accuracy estimate was obtained with the Super Learner ensemble learning algorithm, with a value of 99,4%. This study means that ensemble machine learning algorithms can be considered better than single-based machine learning algorithms in predicting diabetes by using the Early-stage diabetes risk prediction dataset. This method is aimed at early detection of diabetes to assist the clinics.
Benzer Tezler
- A hybrid deep learning metaheuristic model for diagnosis of diabetic retinopathy
Diyabetik retinopatinin tanısı için hibrit bir derin öğrenme meta-sezgisel modeli
ÖMER FARUK GÜRCAN
Doktora
İngilizce
2022
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ÖMER FARUK BEYCA
- Özellik çıkarma ve DVM tabanlı AdaBoost algoritması ile biyomedikal veri sınıflandırma
Biomedical data classification with feature extraction and SVM based AdaBoost algorithm
MÜCAHİD BARSTUĞAN
Yüksek Lisans
Türkçe
2014
Elektrik ve Elektronik MühendisliğiSelçuk ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. RAHİME CEYLAN
- Diyabetik retinopati teşhisine yönelik yapay zekâ tabanlı karar destek modeli
An artificial intelligence-based decision support model for diabetic retinopathy diagnosis
ABDULRAHMAN ÇAVLI
Yüksek Lisans
Türkçe
2024
Bilgi ve Belge YönetimiFırat ÜniversitesiTeknoloji ve Bilgi Yönetimi Ana Bilim Dalı
DOÇ. DR. MESUT TOĞAÇAR
- Retina görüntülerinin kalite değerlendirmesi ve diyabetik retinopati hastalığının tespiti
Retinal image quality assessment and detection of diabetic retinopathy disease
UĞUR ŞEVİK
Doktora
Türkçe
2014
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKaradeniz Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. CEMAL KÖSE
- Sezgisel hibrit öğrenme yöntemleri ile sağlık verilerinin analizi
Analysis of health data with heuristic hybrid learning methods
HATİCE NİZAM ÖZOĞUR
Doktora
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Üniversitesi-CerrahpaşaBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. ZEYNEP ORMAN