A machine learning classification approach for diabetes and biomedical data
Diyabet ve biyomedikal veri için bir makine öğrenmesi sınıflandırma yaklaşımı
- Tez No: 777938
- Danışmanlar: DOÇ. DR. İBRAHİM BERKAN AYDİLEK
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: İngilizce
- Üniversite: Harran Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 59
Özet
Dünyada her türlü yaş ve farklı sosyoekonomik seviyede olan insanlara, daha önce hiç olmadığı kadar yüksek oranda diyabet tip 2 teşhisi konulmaktadır. Diyabet; körlük, böbrek ve kalp hastalığı gibi birçok önemli hastalığın ciddi bir kök sebebi olarak görülmektedir. Bu sebeple, eldeki tıbbi veriye dayalı olarak diyabet hastalığını güvenilir bir şekilde tespit edebilen teşhis sistemlerinin oluşturulması oldukça büyük önem taşımaktadır. Bu tezde; diyabet, kalp-c, kalp-h, hint-karaciğer, vertebral-kolon-2c, vertebral-kolon-3c, parkinson ve tiroid biyomedikal veri kümelerinin sınıflandırılması için metot-tabanlı makine öğrenmesi yöntemleri önerildi. Önerilen yöntem; veri önişleme, öznitelik seçimi ve sınıflandırma gibi birkaç aşamadan oluşmaktadır. Bu çalışma, sonraki aşamalarda kullanılan veri setini iyileştirmek için daha çok önişleme aşamasına odaklanmaktadır. Bahsedilen önişleme aşamalarında; ilk olarak veri temizleme yapılarak, eksik değerler, ortalama değerler ile tamamlanmaktadır. Daha sonra, Dara metodu ile veri yeniden örneklemesi gerçekleştirilmekte ve arkasından veri normalizasyonu uygulanmaktadır. En son olarak ise öznitelik seçimi için Temel Bileşen Analizi (TBA) kullanılmaktadır. Önişlemeden sonra sınıflandırma için 4 farklı yöntem; J48, KNN, RF ve DT kullanılmaktadır. Başarıların değerlendirilmesi için 10 katlamalı çapraz doğrulama yöntemi kullanılarak sonuçlar elde edilmektedir. Bu şekilde, RF algoritması ile PIMA diyabet veri kümesi için %97,8 doğruluk, duyarlılık ve kesinlik sonuçları elde edilmiştir. Elde edilen sonuçlara dayanarak önerilen yöntemin, diyabet hastalığını yüksek doğrulukla sınıflayabilen, etkili ve verimli bir makine öğrenme sisteminin geliştirilmesi için kullanılabileceğini göstermektedir. Biyomedikal veri kümeleri üzerinde yapılan sonraki deneysel çalışmalarda önerilen yöntemin performansı sınanmakta ve parkinson veri kümesi için %99 doğruluk, duyarlılık ve kesinlik sonuçlarının elde edildiği görülmektedir.
Özet (Çeviri)
People of all ages and different socioeconomic levels around the world are being diagnosed with diabetes type 2 at a higher rate than ever before. Diabetes; it is seen as an serious root cause of many important diseases such as blindness, kidney and heart diseases. For this reason, it is of great importance to establish diagnostic systems that can reliably detect diabetes based on the available medical data. In this thesis; method-based machine learning methods are proposed for classification of diabetes, heart-c, heart-h, indian-liver, vertebral-column-2c, vertebral-column-3c, parkinsons and thyroid biomedical datasets. The proposed method consists of several stages including data preprocessing, feature extraction and classification. This study focuses more on the preprocessing stage to improve the data set used in the next stages. In the mentioned preprocessing stages; firstly, the data is cleaned and the missing values are completed with the mean values. Then, data resampling is performed with the Dara method and then data normalization is applied. Finally, Principal Component Analysis (PCA) is used for feature extraction . 4 different methods for classification after preprocessing; J48, KNN, RF and DT are used. The results are obtained by using the 10-fold cross validation method to evaluate the achievements. In this way, 97.8% accuracy, recall and precision results were obtained for the PIMA diabetes dataset with the RF algorithm. Based on the results obtained the proposed method can be used to develop an effective and efficient machine learning system that can classify diabetes with high accuracy. In subsequent experimental studies on biomedical datasets, the performance of the proposed method is tested, and it is seen that 99% accuracy, sensitivity and precision results are obtained for the parkinsons dataset.
Benzer Tezler
- Akıllı telefon tabanlı kolorimetrik glikoz tayininde yapay zeka yaklaşımı
Artificial intelligence approach for smartphone based colorimetric glucose detection
ÖYKÜ BERFİN MERCAN
Yüksek Lisans
Türkçe
2021
Elektrik ve Elektronik Mühendisliğiİzmir Katip Çelebi ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ VOLKAN KILIÇ
DOÇ. DR. MUSTAFA ŞEN
- Makine öğrenmesi tabanlı gerçek zamanlı medikal nesnelerin interneti çerçevesinin geliştirilmesi
Development of machine learning-based real-time medical internet of things framework
EMRE YILDIRIM
Doktora
Türkçe
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolDüzce ÜniversitesiElektrik-Elektronik ve Bilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. ALİ ÇALHAN
- Medical data analysis and model development based on machine learning using apache spark technology
Apache spark teknolojisi kullanılarak sağlık verilerinin analizi ve makine öğrenimine dayalı modelin geliştirilmesi
ANAR TAGHIYEV
Doktora
İngilizce
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSelçuk ÜniversitesiBilişim Teknolojileri Mühendisliği Ana Bilim Dalı
PROF. DR. ADEM ALPASLAN ALTUN
- A hybrid deep learning metaheuristic model for diagnosis of diabetic retinopathy
Diyabetik retinopatinin tanısı için hibrit bir derin öğrenme meta-sezgisel modeli
ÖMER FARUK GÜRCAN
Doktora
İngilizce
2022
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ÖMER FARUK BEYCA
- XGboost ve karar ağacı tabanlı algoritmaların diyabet veri setleri üzerine uygulaması
Application of XGboost and decision tree based algorithms on diabetes data
GÜLÇİN YANGIN
Yüksek Lisans
Türkçe
2019
İstatistikMimar Sinan Güzel Sanatlar Üniversitesiİstatistik Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ELİF ÖZGE ÖZDAMAR