Geri Dön

A machine learning classification approach for diabetes and biomedical data

Diyabet ve biyomedikal veri için bir makine öğrenmesi sınıflandırma yaklaşımı

  1. Tez No: 777938
  2. Yazar: SARBAST JALO HASHIM ALZEBARI
  3. Danışmanlar: DOÇ. DR. İBRAHİM BERKAN AYDİLEK
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: İngilizce
  9. Üniversite: Harran Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 59

Özet

Dünyada her türlü yaş ve farklı sosyoekonomik seviyede olan insanlara, daha önce hiç olmadığı kadar yüksek oranda diyabet tip 2 teşhisi konulmaktadır. Diyabet; körlük, böbrek ve kalp hastalığı gibi birçok önemli hastalığın ciddi bir kök sebebi olarak görülmektedir. Bu sebeple, eldeki tıbbi veriye dayalı olarak diyabet hastalığını güvenilir bir şekilde tespit edebilen teşhis sistemlerinin oluşturulması oldukça büyük önem taşımaktadır. Bu tezde; diyabet, kalp-c, kalp-h, hint-karaciğer, vertebral-kolon-2c, vertebral-kolon-3c, parkinson ve tiroid biyomedikal veri kümelerinin sınıflandırılması için metot-tabanlı makine öğrenmesi yöntemleri önerildi. Önerilen yöntem; veri önişleme, öznitelik seçimi ve sınıflandırma gibi birkaç aşamadan oluşmaktadır. Bu çalışma, sonraki aşamalarda kullanılan veri setini iyileştirmek için daha çok önişleme aşamasına odaklanmaktadır. Bahsedilen önişleme aşamalarında; ilk olarak veri temizleme yapılarak, eksik değerler, ortalama değerler ile tamamlanmaktadır. Daha sonra, Dara metodu ile veri yeniden örneklemesi gerçekleştirilmekte ve arkasından veri normalizasyonu uygulanmaktadır. En son olarak ise öznitelik seçimi için Temel Bileşen Analizi (TBA) kullanılmaktadır. Önişlemeden sonra sınıflandırma için 4 farklı yöntem; J48, KNN, RF ve DT kullanılmaktadır. Başarıların değerlendirilmesi için 10 katlamalı çapraz doğrulama yöntemi kullanılarak sonuçlar elde edilmektedir. Bu şekilde, RF algoritması ile PIMA diyabet veri kümesi için %97,8 doğruluk, duyarlılık ve kesinlik sonuçları elde edilmiştir. Elde edilen sonuçlara dayanarak önerilen yöntemin, diyabet hastalığını yüksek doğrulukla sınıflayabilen, etkili ve verimli bir makine öğrenme sisteminin geliştirilmesi için kullanılabileceğini göstermektedir. Biyomedikal veri kümeleri üzerinde yapılan sonraki deneysel çalışmalarda önerilen yöntemin performansı sınanmakta ve parkinson veri kümesi için %99 doğruluk, duyarlılık ve kesinlik sonuçlarının elde edildiği görülmektedir.

Özet (Çeviri)

People of all ages and different socioeconomic levels around the world are being diagnosed with diabetes type 2 at a higher rate than ever before. Diabetes; it is seen as an serious root cause of many important diseases such as blindness, kidney and heart diseases. For this reason, it is of great importance to establish diagnostic systems that can reliably detect diabetes based on the available medical data. In this thesis; method-based machine learning methods are proposed for classification of diabetes, heart-c, heart-h, indian-liver, vertebral-column-2c, vertebral-column-3c, parkinsons and thyroid biomedical datasets. The proposed method consists of several stages including data preprocessing, feature extraction and classification. This study focuses more on the preprocessing stage to improve the data set used in the next stages. In the mentioned preprocessing stages; firstly, the data is cleaned and the missing values are completed with the mean values. Then, data resampling is performed with the Dara method and then data normalization is applied. Finally, Principal Component Analysis (PCA) is used for feature extraction . 4 different methods for classification after preprocessing; J48, KNN, RF and DT are used. The results are obtained by using the 10-fold cross validation method to evaluate the achievements. In this way, 97.8% accuracy, recall and precision results were obtained for the PIMA diabetes dataset with the RF algorithm. Based on the results obtained the proposed method can be used to develop an effective and efficient machine learning system that can classify diabetes with high accuracy. In subsequent experimental studies on biomedical datasets, the performance of the proposed method is tested, and it is seen that 99% accuracy, sensitivity and precision results are obtained for the parkinsons dataset.

Benzer Tezler

  1. Akıllı telefon tabanlı kolorimetrik glikoz tayininde yapay zeka yaklaşımı

    Artificial intelligence approach for smartphone based colorimetric glucose detection

    ÖYKÜ BERFİN MERCAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    Elektrik ve Elektronik Mühendisliğiİzmir Katip Çelebi Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ VOLKAN KILIÇ

    DOÇ. DR. MUSTAFA ŞEN

  2. Makine öğrenmesi tabanlı gerçek zamanlı medikal nesnelerin interneti çerçevesinin geliştirilmesi

    Development of machine learning-based real-time medical internet of things framework

    EMRE YILDIRIM

    Doktora

    Türkçe

    Türkçe

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolDüzce Üniversitesi

    Elektrik-Elektronik ve Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ALİ ÇALHAN

  3. Medical data analysis and model development based on machine learning using apache spark technology

    Apache spark teknolojisi kullanılarak sağlık verilerinin analizi ve makine öğrenimine dayalı modelin geliştirilmesi

    ANAR TAGHIYEV

    Doktora

    İngilizce

    İngilizce

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSelçuk Üniversitesi

    Bilişim Teknolojileri Mühendisliği Ana Bilim Dalı

    PROF. DR. ADEM ALPASLAN ALTUN

  4. A hybrid deep learning metaheuristic model for diagnosis of diabetic retinopathy

    Diyabetik retinopatinin tanısı için hibrit bir derin öğrenme meta-sezgisel modeli

    ÖMER FARUK GÜRCAN

    Doktora

    İngilizce

    İngilizce

    2022

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ÖMER FARUK BEYCA

  5. XGboost ve karar ağacı tabanlı algoritmaların diyabet veri setleri üzerine uygulaması

    Application of XGboost and decision tree based algorithms on diabetes data

    GÜLÇİN YANGIN

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    İstatistikMimar Sinan Güzel Sanatlar Üniversitesi

    İstatistik Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ELİF ÖZGE ÖZDAMAR