Veri madenciliği yöntemlerinin diyabet tahmininde kullanılması
Use of data mi̇ni̇ng methods i̇n di̇abetes prediction
- Tez No: 855658
- Danışmanlar: DR. ÖĞR. ÜYESİ ÖZGE YÜCEL KASAP
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: Türkçe
- Üniversite: Bahçeşehir Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Bilgi Teknolojileri Bilim Dalı
- Sayfa Sayısı: 63
Özet
Bu tez çalışmasında önerilen yöntemler ve makine öğrenmesi algoritmaları kullanılarak diyabet hastalığına yatkın bireyler erkenden tespit edilmiştir. Böylece diyabet hastalığı erkenden teşhis edilebilecek ve tedaviye vakit kaybetmeden başlanabilecektir. Bu çalışmada, KAGGLE veri havuzundan temin edilen diyabet hastalarına yönelik bilgileri içeren iki farklı diyabet veri seti birleştirilerek kullanılmıştır. Verilerin analizi yapılarak insanların diyabet hastalığına yatkınlığını belirleyen en önemli faktörler tespit edilmiştir. Veri madenciliğinde kullanılan WEKA ve RapidMiner aracı ile diyabet verilerinin sınıflandırması yapılmıştır. Sınıflandırma görevini gerçekleştirmek için makine öğrenimi algoritmalarından K-Nearest Neighbor, Navie Bayes, Random Forest, Gaussian Processes, Linear Regression, Decision Table, M5P Rule ve Decision Stump algoritmaları kullanılmıştır. Decision Table sınıflandırıcısı kullanılarak kişilerin diyabet hastalığına yatkınlığı %96,87'lik doğruluk oranı ile başarılı bir şekilde sınıflandırılmıştır. Yapılan deneylerin sonuçlarına göre geliştirilen yöntemin ve kullanılan sınıflandırma algoritmalarının diyabet hastalığına yatkın insanları başarılı bir şekilde tespit ederek sınıflandırdığı görülmüştür.
Özet (Çeviri)
In this thesis, individuals prone to diabetes were detected early by using the proposed methods and machine learning algorithms. Thus, diabetes can be diagnosed early and treatment can be started without delay. In this study, two different data sets containing information on diabetic patients obtained from the KAGGLE data repository were combined and used. The most important factors that determine poeple's susceptibility to diabetes have been identified by analyzing the data. Data mining tools WEKA and RapidMiner were used for classifying diabetes data. The Machine Learning algorithms which are K-Nearest Neighbor, Navie Bayes, Random Forest, Gaussian Processes, Linear Regression, Decision Table, M5P Rule and Decision Stump were used to perform classification task. The tendency of individuals for diabetes was successfully classified with a 96,87% accuracy rate using the Decision Table classifier. According to the experimental results show that the developed method and the used classification algorithms successfully classified the people prone to diabetes.
Benzer Tezler
- Sağlık alanında büyük veri ve veri madenciliği yöntemlerinin kullanımı
Big data and data mining methodologies in medicine
BATUHAN BAKIRARAR
Yüksek Lisans
Türkçe
2016
BiyoistatistikAnkara ÜniversitesiBiyoistatistik Ana Bilim Dalı
PROF. DR. YASEMİN YAVUZ
- Tıbbi karar destek sisteminin veri madenciliği yöntemleriyle gerçekleştirilmesi
Verifying medical decision support system with the methods of data mining
TUBA PALA
Yüksek Lisans
Türkçe
2013
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMarmara ÜniversitesiElektronik-Bilgisayar Eğitimi Ana Bilim Dalı
PROF. DR. A. YILMAZ ÇAMURCU
- Farklı sınıflandırma yöntemlerinin karşılaştırılması ve bir uygulama
An application on the comparison of various classification methods
EBRU EKİCİ
Yüksek Lisans
Türkçe
2012
İstatistikFırat Üniversitesiİstatistik Ana Bilim Dalı
YRD. DOÇ. DR. NURHAN HALİSDEMİR
- Veri madenciliğinde kümeleme analizi yöntemlerinin incelenmesi ve sağlık bilimleri alanındaki uygulamaları
Evulation of cluster analysis in the methods of data mining and its applications in health sciences
NİHAN MÜNİSE KAZAZ
Yüksek Lisans
Türkçe
2019
Biyoistatistikİstanbul ÜniversitesiBiyoistatistik Ana Bilim Dalı
PROF. DR. AHMET DİRİCAN
- Diyabet hastalarına ait verilerin istatistiksel yöntemler ve veri madenciliği teknikleri kullanılarak incelenmesi
Analysis of data for diabets patients using statistical methods and data mining tecniques
MERVE DÜNDER
Yüksek Lisans
Türkçe
2021
İstatistikOndokuz Mayıs Üniversitesiİstatistik Ana Bilim Dalı
DOÇ. DR. EROL TERZİ