Classification of diabetes data set from Iraq via different machine learning techniques
Irak'tan alınan diyabet verilerinin farklı makine öğrenme teknikleri ile sınıflandırılması
- Tez No: 721683
- Danışmanlar: PROF. DR. FEVZİ ERDOĞAN
- Tez Türü: Yüksek Lisans
- Konular: İstatistik, Statistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: İngilizce
- Üniversite: Van Yüzüncü Yıl Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: İstatistik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 150
Özet
Uluslararası Diyabet Federasyonu verileri, dünya çapında yüz milyonlarca insanın diyabetle yaşadığını göstermektedir. Günümüzde diyabet en önemli ölüm nedenleri arasında yer almaktadır. Makine öğrenimi yaklaşımları, Irak'taki diyabetik hastalardan toplanan tanısal tıbbi veri kümelerinden tahmine dayalı modeller oluşturarak bilgi çıkarımı için etkili sonuçlar sağlamaktadır. Sınıflandırma, çok önemli denetimli veri tekniklerinden birisidir. Bu çalışmada, makine öğrenme ve sınıflandırma performanslarını belirlemek amacıyla; Regresyon Ağaçları (CART), Doğrusal Ayırma Analizi (LDA), Destek Vektör Makinesi (SVM), K-En Yakın Komşular (K-NN) ve Rastgele Orman (RF) sınıflandırma algoritmaları kullanılmış ve bu algoritmalar karşılaştırılmıştır. Veriler üzerinde algoritma modelleri eğitilmiş ve uygun sayıda katlama ve iterasyon ile tekrarlı çapraz doğrulama kullanılarak modeller karşılaştırılmıştır. Algoritmalardan elde edilen sonuçlar eğitim verileriyle karşılaştırıldığında, ilgili algoritmaların doğruluk sıraları eğitim verileriyle tamamen aynı sonuçları göstermektedir. Test veri sonuçları doğruluk sıralamasında bazı farklılıklar gösterirken, algoritmaların sırasıyla en yüksek sıralaması SVM, RF, CART, LDA ve KNN şeklinde belirlenmiştir. Eğitim veri seti, modeli oluşturmak için kullanılan örnekleri ifade ederken, test veri seti, modelin performansını değerlendirmek için kullanılmaktadır. Çalışma bulgularının, Irak'ta diyabetin erken teşhis ve kontrol altına alınması için daha iyi klinik kararlar alınmasında sağlık çalışanlarına yardımcı olacağı ve dolayısıyla potansiyel olarak hayat kurtaracağı umulmaktadır. Çalışmada gerekli analizler için R-Studio paket programı kullanılmıştır.
Özet (Çeviri)
International Diabetes Federation data shows that hundreds of millions of people live with diabetes worldwide. Nowadays, diabetes is consistently listed as the number one cause of death. Machine learning approaches provide effective results for information extraction by creating predictive models from diagnostic medical datasets collected from diabetic patients in Iraq. One of the really crucial supervised data techniques is classification. We apply machine learning to compare and contrast the performance of Classification and Regression Trees (CART), Linear Discrimination Analysis (LDA), Support Vector Machine (SVM), K-Nearest Neighbors (K-NN), and Random Forest (RF) in this study. We train the models of the algorithms on the data and compare the models using iterative cross-validation with the appropriate number of folds and iterations. Based on the results obtained from the algorithms, it shows that the accuracy and sequence of the algorithms concerning the training data are completely identical to the results of the comprehensive comparison because the latter mainly depends on the results training data RF, CART, SVM, LDA, and KNN. While the test data results showed some difference, the sequence of the algorithms was as SVM, RF, CART, LDA, and KNN being the highest, respectively. The training data set refers to the samples that were used to construct the model, whereas the testing data set is used to evaluate the model's performance. The study's findings will help healthcare workers detect diabetes in Iraq early and make better clinical decisions to control it, potentially saving lives. R-Studio used in this study.
Benzer Tezler
- XGboost ve karar ağacı tabanlı algoritmaların diyabet veri setleri üzerine uygulaması
Application of XGboost and decision tree based algorithms on diabetes data
GÜLÇİN YANGIN
Yüksek Lisans
Türkçe
2019
İstatistikMimar Sinan Güzel Sanatlar Üniversitesiİstatistik Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ELİF ÖZGE ÖZDAMAR
- Tıbbi karar destek sisteminin veri madenciliği yöntemleriyle gerçekleştirilmesi
Verifying medical decision support system with the methods of data mining
TUBA PALA
Yüksek Lisans
Türkçe
2013
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMarmara ÜniversitesiElektronik-Bilgisayar Eğitimi Ana Bilim Dalı
PROF. DR. A. YILMAZ ÇAMURCU
- Zeki sınıflandırma ve kümeleme yöntemlerinin tıbbi tanı ve tedavide kullanımı
The usage of intelligent classification and clustering methods in medical diagnosis and treatment
UĞUR ERKİN KOCAMAZ
Doktora
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya ÜniversitesiBilgisayar ve Bilişim Mühendisliği Ana Bilim Dalı
PROF. DR. HARUN TAŞKIN
- Sınıflandırma model performansını geliştirmede ortak karar yaklaşımı ile biyobelirteç keşfi
A consensus approach with biomarker discovery to increase performance of classification model
AYÇA PAMUKCU
Yüksek Lisans
Türkçe
2016
BiyoistatistikMimar Sinan Güzel Sanatlar Üniversitesiİstatistik Ana Bilim Dalı
YRD. DOÇ. DR. AYÇA ÇAKMAK PEHLİVANLI
- Diyabet tespitinde makine öğrenmesi algoritmaları yaklaşımını kullanarak yapılmış bir çalışma
A study using the approach of machine learning algorithm in detection of diabetes
AYŞE DOĞRU
Yüksek Lisans
Türkçe
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÇankırı Karatekin ÜniversitesiElektrik ve Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. MURAT ARI
DR. ÖĞR. ÜYESİ SELİM BUYRUKOĞLU