Geri Dön

Classification of diabetes data set from Iraq via different machine learning techniques

Irak'tan alınan diyabet verilerinin farklı makine öğrenme teknikleri ile sınıflandırılması

  1. Tez No: 721683
  2. Yazar: DILSHAD OMAR M.SAEED ALTALABANI
  3. Danışmanlar: PROF. DR. FEVZİ ERDOĞAN
  4. Tez Türü: Yüksek Lisans
  5. Konular: İstatistik, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: İngilizce
  9. Üniversite: Van Yüzüncü Yıl Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 150

Özet

Uluslararası Diyabet Federasyonu verileri, dünya çapında yüz milyonlarca insanın diyabetle yaşadığını göstermektedir. Günümüzde diyabet en önemli ölüm nedenleri arasında yer almaktadır. Makine öğrenimi yaklaşımları, Irak'taki diyabetik hastalardan toplanan tanısal tıbbi veri kümelerinden tahmine dayalı modeller oluşturarak bilgi çıkarımı için etkili sonuçlar sağlamaktadır. Sınıflandırma, çok önemli denetimli veri tekniklerinden birisidir. Bu çalışmada, makine öğrenme ve sınıflandırma performanslarını belirlemek amacıyla; Regresyon Ağaçları (CART), Doğrusal Ayırma Analizi (LDA), Destek Vektör Makinesi (SVM), K-En Yakın Komşular (K-NN) ve Rastgele Orman (RF) sınıflandırma algoritmaları kullanılmış ve bu algoritmalar karşılaştırılmıştır. Veriler üzerinde algoritma modelleri eğitilmiş ve uygun sayıda katlama ve iterasyon ile tekrarlı çapraz doğrulama kullanılarak modeller karşılaştırılmıştır. Algoritmalardan elde edilen sonuçlar eğitim verileriyle karşılaştırıldığında, ilgili algoritmaların doğruluk sıraları eğitim verileriyle tamamen aynı sonuçları göstermektedir. Test veri sonuçları doğruluk sıralamasında bazı farklılıklar gösterirken, algoritmaların sırasıyla en yüksek sıralaması SVM, RF, CART, LDA ve KNN şeklinde belirlenmiştir. Eğitim veri seti, modeli oluşturmak için kullanılan örnekleri ifade ederken, test veri seti, modelin performansını değerlendirmek için kullanılmaktadır. Çalışma bulgularının, Irak'ta diyabetin erken teşhis ve kontrol altına alınması için daha iyi klinik kararlar alınmasında sağlık çalışanlarına yardımcı olacağı ve dolayısıyla potansiyel olarak hayat kurtaracağı umulmaktadır. Çalışmada gerekli analizler için R-Studio paket programı kullanılmıştır.

Özet (Çeviri)

International Diabetes Federation data shows that hundreds of millions of people live with diabetes worldwide. Nowadays, diabetes is consistently listed as the number one cause of death. Machine learning approaches provide effective results for information extraction by creating predictive models from diagnostic medical datasets collected from diabetic patients in Iraq. One of the really crucial supervised data techniques is classification. We apply machine learning to compare and contrast the performance of Classification and Regression Trees (CART), Linear Discrimination Analysis (LDA), Support Vector Machine (SVM), K-Nearest Neighbors (K-NN), and Random Forest (RF) in this study. We train the models of the algorithms on the data and compare the models using iterative cross-validation with the appropriate number of folds and iterations. Based on the results obtained from the algorithms, it shows that the accuracy and sequence of the algorithms concerning the training data are completely identical to the results of the comprehensive comparison because the latter mainly depends on the results training data RF, CART, SVM, LDA, and KNN. While the test data results showed some difference, the sequence of the algorithms was as SVM, RF, CART, LDA, and KNN being the highest, respectively. The training data set refers to the samples that were used to construct the model, whereas the testing data set is used to evaluate the model's performance. The study's findings will help healthcare workers detect diabetes in Iraq early and make better clinical decisions to control it, potentially saving lives. R-Studio used in this study.

Benzer Tezler

  1. XGboost ve karar ağacı tabanlı algoritmaların diyabet veri setleri üzerine uygulaması

    Application of XGboost and decision tree based algorithms on diabetes data

    GÜLÇİN YANGIN

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    İstatistikMimar Sinan Güzel Sanatlar Üniversitesi

    İstatistik Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ELİF ÖZGE ÖZDAMAR

  2. Tıbbi karar destek sisteminin veri madenciliği yöntemleriyle gerçekleştirilmesi

    Verifying medical decision support system with the methods of data mining

    TUBA PALA

    Yüksek Lisans

    Türkçe

    Türkçe

    2013

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMarmara Üniversitesi

    Elektronik-Bilgisayar Eğitimi Ana Bilim Dalı

    PROF. DR. A. YILMAZ ÇAMURCU

  3. Zeki sınıflandırma ve kümeleme yöntemlerinin tıbbi tanı ve tedavide kullanımı

    The usage of intelligent classification and clustering methods in medical diagnosis and treatment

    UĞUR ERKİN KOCAMAZ

    Doktora

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya Üniversitesi

    Bilgisayar ve Bilişim Mühendisliği Ana Bilim Dalı

    PROF. DR. HARUN TAŞKIN

  4. Sınıflandırma model performansını geliştirmede ortak karar yaklaşımı ile biyobelirteç keşfi

    A consensus approach with biomarker discovery to increase performance of classification model

    AYÇA PAMUKCU

    Yüksek Lisans

    Türkçe

    Türkçe

    2016

    BiyoistatistikMimar Sinan Güzel Sanatlar Üniversitesi

    İstatistik Ana Bilim Dalı

    YRD. DOÇ. DR. AYÇA ÇAKMAK PEHLİVANLI

  5. Diyabet tespitinde makine öğrenmesi algoritmaları yaklaşımını kullanarak yapılmış bir çalışma

    A study using the approach of machine learning algorithm in detection of diabetes

    AYŞE DOĞRU

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÇankırı Karatekin Üniversitesi

    Elektrik ve Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. MURAT ARI

    DR. ÖĞR. ÜYESİ SELİM BUYRUKOĞLU