Geri Dön

Erken dönem diyabet riskinin makine öğrenmesi ve istatistiksel yöntemlerle tahmini

Prediction of early-stage diabetes risk with machine learning and statistical techniques

  1. Tez No: 856507
  2. Yazar: YUSUF HALLAÇ
  3. Danışmanlar: PROF. DR. SİNAN ÇALIK
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, İstatistik, Computer Engineering and Computer Science and Control, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: Türkçe
  9. Üniversite: Fırat Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: İstatistik Bilgi Sistemleri Bilim Dalı
  13. Sayfa Sayısı: 70

Özet

Makine öğrenmesi ve istatistiksel yöntemler, sağlık, ekonomi ve diğer birçok sektörde büyük verilerin doğru ve anlamlı bir şekilde analiz edilmesine ve iş yükünün hafifletilmesine katkıda bulunmaktadır. Bu tez çalışmasında, literatüre katkı sağlamak amacıyla yüksek doğruluklu tahmin oranına sahip, makine öğrenmesi temelli, diyabet hastalığı erken teşhis modelleri geliştirilmiştir. Sağlık sektörü açısından, bu modellerin erken teşhislerde klinik karar süreçlerine etkili bir şekilde yardımcı olması beklenmektedir. Tezde sağlık verisinin elde edilmesinden kaynaklanan zorlukların sentetik veriler aracılığıyla üstesinden gelinmesine, erken dönem diyabet riskine yol açan faktörlerin araştırılmasına ve belirli klinik bulguların çeşitli durumların tahmininde kullanılmasına yardımcı olacak makine öğrenmesi temelli yaklaşımlar önerilmiştir. Ayrıca kullanılan veri setinde demografik değişkenlerin istatistiksel analizlerine yer verilmiştir. Tez çalışması kapsamında kullanılan veri setinin boyutunun küçük olması ve sınıf dengesizliği içermesi durumu detaylı olarak ele alınmıştır. SMOTE, ROS, RUS ve ADASYN sınıf dengesizliği stratejileri diyabet erken teşhis tahmini problemi özelinde açıklanarak uygulanan makine öğrenmesi yöntemlerinin başarısı üzerinde nasıl performans gösterdikleri detaylı olarak sunulmuştur. Elde edilen sonuçlarda SMOTE ve ADASYN yöntemleriyle veri setinin dengelenmesi sonrasında elde edilen başarı oranlarının esas veri seti üzerinden eğitilen makine öğrenmesi modellerine göre başarı metriklerinin (doğruluk, F1 skor, Kappa, hassasiyet, Roc AUC) genellikle arttırdığı görülmüştür. Özellikle YSA, DVM ve RO modelleri için yüksek doğruluk değerleri elde edilmiştir. DVM algoritması ADASYN uygulanması ile 0.99, SMOTE uygulanması ile 0.98 doğruluk değeri almıştır. YSA ve RO ise ADASYN ile 0.99 doğruluk değeri vermiştir. Bu sonuçlar, ADASYN ve SMOTE yöntemlerinin genel olarak dengesiz veri seti üzerinde sınıflandırma performansını arttırdığını göstermiştir. RUS ile dengelenen veri setinin ise herhangi bir performans artışına katkı sağlamadığı tespit edilmiştir.

Özet (Çeviri)

Machine learning and statistical methods contribute to the accurate and meaningful analysis of big data in healthcare, economics, and many other sectors, thereby relieving the workload. In this thesis, machine learning-based early diagnosis models for diabetes, which exhibit high accuracy prediction rates, were developed with the aim of contributing to the existing literature. It is expected that these models will effectively assist in clinical decision-making processes in early diagnoses within the healthcare sector. In the thesis, overcoming the challenges associated with obtaining health data in larger quantities has been facilitated through synthetic data. Additionally, machine learning-based approaches have been proposed to investigate factors contributing to early diabetes risk and to assist in predicting various conditions using specific clinical findings. Furthermore, statistical analyses of demographic variables in the dataset have been included. The thesis extensively discusses the small size and class imbalance of the dataset used in the study. Strategies for class imbalance such as SMOTE, ROS, RUS, and ADASYN are explained concerning their performance on the early diabetes diagnosis prediction problem. Results indicate that balancing the dataset with SMOTE and ADASYN generally improved performance metrics (accuracy, F1 score, Kappa, precision, Roc AUC) compared to models trained on the original dataset. Particularly high accuracy values were obtained for ANN, SVM, and RF models. The SVM algorithm achieved a 0.99 accuracy value with ADASYN and 0.98 with SMOTE. ANN and RF achieved a 0.99 accuracy value with ADASYN. These results demonstrate that ADASYN and SMOTE methods generally enhance classification performance on imbalanced datasets.

Benzer Tezler

  1. Preeklamptik annelerden doğan prematüre bebeklerde erken dönem prognoz

    Preeklamptik annelerden doğan prematüre bebeklerde erken dönem prognoz

    OSEN ARI

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2016

    Çocuk Sağlığı ve HastalıklarıSağlık Bakanlığı

    Çocuk Sağlığı ve Hastalıkları Ana Bilim Dalı

    DOÇ. DR. Teoman Akçay

  2. Anti-glutamikasit dekarboksilaz antikoru, adacık antikoru, insülin otoantikoru, anti-gastrik parietal hücre antikorunun preklinik ve klinik dönem otoimmün tip 1 diyabette erken tanı kriteri olarak etkinliklerinin değerlendirilmesi

    Evaluation of the efficiency of anti-glutamicacid decarboxilase antibody and anti-gastric parietal cell antibody as early diagnostic factors in preclinic autoimmune type 1 diabetes

    GAYE YILLAR

    Doktora

    Türkçe

    Türkçe

    2002

    Allerji ve İmmünolojiİstanbul Üniversitesi

    İmmünoloji Ana Bilim Dalı

    PROF.DR. M. TEMEL YILMAZ

  3. Prematüre bebeklerin uzun dönem böbrek fonksiyonlarının değerlendirilmesi

    Evaluation of LONG-TERM kidney functions of preterm infants

    EMİNE ÇELİK

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2023

    Çocuk Sağlığı ve Hastalıklarıİstanbul Medeniyet Üniversitesi

    Çocuk Sağlığı ve Hastalıkları Ana Bilim Dalı

    DOÇ. DR. NURAN ÜSTÜN

  4. Diyabetik ayak olgularında mortalite üzerine etkili faktörler ve direkt maliyet

    Mortality related factors and direct cost in diabetic foot ulcers

    MOHAMMED MADY

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2004

    Endokrinoloji ve Metabolizma Hastalıklarıİstanbul Üniversitesi

    İç Hastalıkları Ana Bilim Dalı

    PROF. DR. ZEYNEP COŞAR

  5. Piridazinon-üre türevi yeni bileşiklerin sentezi ve biyolojik aktiviteleri üzerine çalışmalar

    Studies on synthesis and biological activity of novel pyridazinon-urea derivatives

    AROOJ BAKHT

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Eczacılık ve FarmakolojiGazi Üniversitesi

    Farmasötik Kimya Ana Bilim Dalı

    PROF. DR. ERDEN BANOĞLU