Erken dönem diyabet riskinin makine öğrenmesi ve istatistiksel yöntemlerle tahmini
Prediction of early-stage diabetes risk with machine learning and statistical techniques
- Tez No: 856507
- Danışmanlar: PROF. DR. SİNAN ÇALIK
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, İstatistik, Computer Engineering and Computer Science and Control, Statistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: Türkçe
- Üniversite: Fırat Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: İstatistik Ana Bilim Dalı
- Bilim Dalı: İstatistik Bilgi Sistemleri Bilim Dalı
- Sayfa Sayısı: 70
Özet
Makine öğrenmesi ve istatistiksel yöntemler, sağlık, ekonomi ve diğer birçok sektörde büyük verilerin doğru ve anlamlı bir şekilde analiz edilmesine ve iş yükünün hafifletilmesine katkıda bulunmaktadır. Bu tez çalışmasında, literatüre katkı sağlamak amacıyla yüksek doğruluklu tahmin oranına sahip, makine öğrenmesi temelli, diyabet hastalığı erken teşhis modelleri geliştirilmiştir. Sağlık sektörü açısından, bu modellerin erken teşhislerde klinik karar süreçlerine etkili bir şekilde yardımcı olması beklenmektedir. Tezde sağlık verisinin elde edilmesinden kaynaklanan zorlukların sentetik veriler aracılığıyla üstesinden gelinmesine, erken dönem diyabet riskine yol açan faktörlerin araştırılmasına ve belirli klinik bulguların çeşitli durumların tahmininde kullanılmasına yardımcı olacak makine öğrenmesi temelli yaklaşımlar önerilmiştir. Ayrıca kullanılan veri setinde demografik değişkenlerin istatistiksel analizlerine yer verilmiştir. Tez çalışması kapsamında kullanılan veri setinin boyutunun küçük olması ve sınıf dengesizliği içermesi durumu detaylı olarak ele alınmıştır. SMOTE, ROS, RUS ve ADASYN sınıf dengesizliği stratejileri diyabet erken teşhis tahmini problemi özelinde açıklanarak uygulanan makine öğrenmesi yöntemlerinin başarısı üzerinde nasıl performans gösterdikleri detaylı olarak sunulmuştur. Elde edilen sonuçlarda SMOTE ve ADASYN yöntemleriyle veri setinin dengelenmesi sonrasında elde edilen başarı oranlarının esas veri seti üzerinden eğitilen makine öğrenmesi modellerine göre başarı metriklerinin (doğruluk, F1 skor, Kappa, hassasiyet, Roc AUC) genellikle arttırdığı görülmüştür. Özellikle YSA, DVM ve RO modelleri için yüksek doğruluk değerleri elde edilmiştir. DVM algoritması ADASYN uygulanması ile 0.99, SMOTE uygulanması ile 0.98 doğruluk değeri almıştır. YSA ve RO ise ADASYN ile 0.99 doğruluk değeri vermiştir. Bu sonuçlar, ADASYN ve SMOTE yöntemlerinin genel olarak dengesiz veri seti üzerinde sınıflandırma performansını arttırdığını göstermiştir. RUS ile dengelenen veri setinin ise herhangi bir performans artışına katkı sağlamadığı tespit edilmiştir.
Özet (Çeviri)
Machine learning and statistical methods contribute to the accurate and meaningful analysis of big data in healthcare, economics, and many other sectors, thereby relieving the workload. In this thesis, machine learning-based early diagnosis models for diabetes, which exhibit high accuracy prediction rates, were developed with the aim of contributing to the existing literature. It is expected that these models will effectively assist in clinical decision-making processes in early diagnoses within the healthcare sector. In the thesis, overcoming the challenges associated with obtaining health data in larger quantities has been facilitated through synthetic data. Additionally, machine learning-based approaches have been proposed to investigate factors contributing to early diabetes risk and to assist in predicting various conditions using specific clinical findings. Furthermore, statistical analyses of demographic variables in the dataset have been included. The thesis extensively discusses the small size and class imbalance of the dataset used in the study. Strategies for class imbalance such as SMOTE, ROS, RUS, and ADASYN are explained concerning their performance on the early diabetes diagnosis prediction problem. Results indicate that balancing the dataset with SMOTE and ADASYN generally improved performance metrics (accuracy, F1 score, Kappa, precision, Roc AUC) compared to models trained on the original dataset. Particularly high accuracy values were obtained for ANN, SVM, and RF models. The SVM algorithm achieved a 0.99 accuracy value with ADASYN and 0.98 with SMOTE. ANN and RF achieved a 0.99 accuracy value with ADASYN. These results demonstrate that ADASYN and SMOTE methods generally enhance classification performance on imbalanced datasets.
Benzer Tezler
- Preeklamptik annelerden doğan prematüre bebeklerde erken dönem prognoz
Preeklamptik annelerden doğan prematüre bebeklerde erken dönem prognoz
OSEN ARI
Tıpta Uzmanlık
Türkçe
2016
Çocuk Sağlığı ve HastalıklarıSağlık BakanlığıÇocuk Sağlığı ve Hastalıkları Ana Bilim Dalı
DOÇ. DR. Teoman Akçay
- Anti-glutamikasit dekarboksilaz antikoru, adacık antikoru, insülin otoantikoru, anti-gastrik parietal hücre antikorunun preklinik ve klinik dönem otoimmün tip 1 diyabette erken tanı kriteri olarak etkinliklerinin değerlendirilmesi
Evaluation of the efficiency of anti-glutamicacid decarboxilase antibody and anti-gastric parietal cell antibody as early diagnostic factors in preclinic autoimmune type 1 diabetes
GAYE YILLAR
Doktora
Türkçe
2002
Allerji ve İmmünolojiİstanbul Üniversitesiİmmünoloji Ana Bilim Dalı
PROF.DR. M. TEMEL YILMAZ
- Prematüre bebeklerin uzun dönem böbrek fonksiyonlarının değerlendirilmesi
Evaluation of LONG-TERM kidney functions of preterm infants
EMİNE ÇELİK
Tıpta Uzmanlık
Türkçe
2023
Çocuk Sağlığı ve Hastalıklarıİstanbul Medeniyet ÜniversitesiÇocuk Sağlığı ve Hastalıkları Ana Bilim Dalı
DOÇ. DR. NURAN ÜSTÜN
- Diyabetik ayak olgularında mortalite üzerine etkili faktörler ve direkt maliyet
Mortality related factors and direct cost in diabetic foot ulcers
MOHAMMED MADY
Tıpta Uzmanlık
Türkçe
2004
Endokrinoloji ve Metabolizma Hastalıklarıİstanbul Üniversitesiİç Hastalıkları Ana Bilim Dalı
PROF. DR. ZEYNEP COŞAR
- Piridazinon-üre türevi yeni bileşiklerin sentezi ve biyolojik aktiviteleri üzerine çalışmalar
Studies on synthesis and biological activity of novel pyridazinon-urea derivatives
AROOJ BAKHT
Yüksek Lisans
İngilizce
2024
Eczacılık ve FarmakolojiGazi ÜniversitesiFarmasötik Kimya Ana Bilim Dalı
PROF. DR. ERDEN BANOĞLU