Geri Dön

Veri madenciliği yöntemlerinin diyabet tahmininde kullanılması

Use of data mi̇ni̇ng methods i̇n di̇abetes prediction

  1. Tez No: 855658
  2. Yazar: DAMLA HALATCI
  3. Danışmanlar: DR. ÖĞR. ÜYESİ ÖZGE YÜCEL KASAP
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: Türkçe
  9. Üniversite: Bahçeşehir Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgi Teknolojileri Bilim Dalı
  13. Sayfa Sayısı: 63

Özet

Bu tez çalışmasında önerilen yöntemler ve makine öğrenmesi algoritmaları kullanılarak diyabet hastalığına yatkın bireyler erkenden tespit edilmiştir. Böylece diyabet hastalığı erkenden teşhis edilebilecek ve tedaviye vakit kaybetmeden başlanabilecektir. Bu çalışmada, KAGGLE veri havuzundan temin edilen diyabet hastalarına yönelik bilgileri içeren iki farklı diyabet veri seti birleştirilerek kullanılmıştır. Verilerin analizi yapılarak insanların diyabet hastalığına yatkınlığını belirleyen en önemli faktörler tespit edilmiştir. Veri madenciliğinde kullanılan WEKA ve RapidMiner aracı ile diyabet verilerinin sınıflandırması yapılmıştır. Sınıflandırma görevini gerçekleştirmek için makine öğrenimi algoritmalarından K-Nearest Neighbor, Navie Bayes, Random Forest, Gaussian Processes, Linear Regression, Decision Table, M5P Rule ve Decision Stump algoritmaları kullanılmıştır. Decision Table sınıflandırıcısı kullanılarak kişilerin diyabet hastalığına yatkınlığı %96,87'lik doğruluk oranı ile başarılı bir şekilde sınıflandırılmıştır. Yapılan deneylerin sonuçlarına göre geliştirilen yöntemin ve kullanılan sınıflandırma algoritmalarının diyabet hastalığına yatkın insanları başarılı bir şekilde tespit ederek sınıflandırdığı görülmüştür.

Özet (Çeviri)

In this thesis, individuals prone to diabetes were detected early by using the proposed methods and machine learning algorithms. Thus, diabetes can be diagnosed early and treatment can be started without delay. In this study, two different data sets containing information on diabetic patients obtained from the KAGGLE data repository were combined and used. The most important factors that determine poeple's susceptibility to diabetes have been identified by analyzing the data. Data mining tools WEKA and RapidMiner were used for classifying diabetes data. The Machine Learning algorithms which are K-Nearest Neighbor, Navie Bayes, Random Forest, Gaussian Processes, Linear Regression, Decision Table, M5P Rule and Decision Stump were used to perform classification task. The tendency of individuals for diabetes was successfully classified with a 96,87% accuracy rate using the Decision Table classifier. According to the experimental results show that the developed method and the used classification algorithms successfully classified the people prone to diabetes.

Benzer Tezler

  1. Sağlık alanında büyük veri ve veri madenciliği yöntemlerinin kullanımı

    Big data and data mining methodologies in medicine

    BATUHAN BAKIRARAR

    Yüksek Lisans

    Türkçe

    Türkçe

    2016

    BiyoistatistikAnkara Üniversitesi

    Biyoistatistik Ana Bilim Dalı

    PROF. DR. YASEMİN YAVUZ

  2. Tıbbi karar destek sisteminin veri madenciliği yöntemleriyle gerçekleştirilmesi

    Verifying medical decision support system with the methods of data mining

    TUBA PALA

    Yüksek Lisans

    Türkçe

    Türkçe

    2013

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMarmara Üniversitesi

    Elektronik-Bilgisayar Eğitimi Ana Bilim Dalı

    PROF. DR. A. YILMAZ ÇAMURCU

  3. Farklı sınıflandırma yöntemlerinin karşılaştırılması ve bir uygulama

    An application on the comparison of various classification methods

    EBRU EKİCİ

    Yüksek Lisans

    Türkçe

    Türkçe

    2012

    İstatistikFırat Üniversitesi

    İstatistik Ana Bilim Dalı

    YRD. DOÇ. DR. NURHAN HALİSDEMİR

  4. Veri madenciliğinde kümeleme analizi yöntemlerinin incelenmesi ve sağlık bilimleri alanındaki uygulamaları

    Evulation of cluster analysis in the methods of data mining and its applications in health sciences

    NİHAN MÜNİSE KAZAZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Biyoistatistikİstanbul Üniversitesi

    Biyoistatistik Ana Bilim Dalı

    PROF. DR. AHMET DİRİCAN

  5. Diyabet hastalarına ait verilerin istatistiksel yöntemler ve veri madenciliği teknikleri kullanılarak incelenmesi

    Analysis of data for diabets patients using statistical methods and data mining tecniques

    MERVE DÜNDER

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    İstatistikOndokuz Mayıs Üniversitesi

    İstatistik Ana Bilim Dalı

    DOÇ. DR. EROL TERZİ