Geri Dön

Makine öğrenmesi modelleri kullanılarak oral glukoz tolerans testi (OGTT) uygulanmadan glukoz intoleransının tahminlenmesi

Prediction of glucose intolerance without oral glucose tolerance test (OGTT) using machine learning models

  1. Tez No: 857423
  2. Yazar: BANU İŞBİLEN BAŞOK
  3. Danışmanlar: PROF. DR. İPEK DEVECİ KOCAKOÇ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Ekonometri, Econometrics
  6. Anahtar Kelimeler: Gestasyonel diyabetes mellitus, oral glukoz tolerans testi, makine öğrenmesi, Gestational diabetes mellitus, oral glucose tolerance test, machine learning
  7. Yıl: 2024
  8. Dil: Türkçe
  9. Üniversite: Dokuz Eylül Üniversitesi
  10. Enstitü: Sosyal Bilimler Enstitüsü
  11. Ana Bilim Dalı: Ekonometri Ana Bilim Dalı
  12. Bilim Dalı: Veri Yönetimi ve Analizi Bilim Dalı
  13. Sayfa Sayısı: 96

Özet

Araştırma sorusu: Gebelik şekeri olarak da bilinen gestasyonel diyabet mellitus (GDM), ilk kez gebelik sırasında saptanan veya başlayan, anne ve bebek sağlığını olumsuz etkileyen yüksek kan şekeri ile karakterize bir hastalıktır. GDM tanısı hamileliğin 6-7. aylarında şeker içeren solüsyonların gebeye içirilmesi (Oral Glukoz Tolerans Testi (OGTT)) ile konulur. Testin tolere edilememesi ya da bebeğe zarar vereceği düşüncesiyle reddi giderek artmaktadır. Makine öğrenmesi (ML) modelleri kullanılarak GDM tahmini yapılması ve tahmin gücünün değerlendirilmesi amaçlanmıştır. Yöntem: Ekim 2022-Temmuz 2023 tarihlerinde OGTT için Kadın Hastalıkları ve Doğum Hastanesine başvuran 364 gebede yaş, sosyoekonomik, göçmenlik durumu, eğitim düzeyi, sosyoekonomik düzey, sigara/alkol/madde kullanımı, iri bebek doğum öyküsü, GDM öyküsü, ailede DM öyküsü, gebelik öncesi geçirilen hastalıklar, boy, kilo, kan basıncı bilgileri anket usulü ile laboratuvar test sonuçları hasta kayıtlarından alınmıştır. Oluşturulan veri setinde Python dili kullanılarak Jupyter Notebook arayüzünde CatBoost ve LightGBM ML sınıflayıcı algoritmaları geliştirilmiştir. Performans metrikleri ile model performansları belirlenmiştir. Modellerin açıklanabilirlik analizleri SHAP ve“feature importance”yöntemleriyle değerlendirilmiştir. Bulgular: K-katlamalı çapraz doğrulama yönteminden faydalanılarak model eğitimi ve doğrulaması gerçekleştirilmiştir. LGBM ve CatBoost ML modellerinin performans metrikleri benzer bulunmuştur. Doğruluk metriğinde CatBoost modelinin doğruluk yüzdesi LGBM'den düşük olmasına rağmen, ROC analizinde AUC'u daha yüksek bulunmuştur. Her iki ML modelinin SHAP analizleri karşılaştırıldığında vücut kitle indeksi, mevcut kilo, yaş ve eritrosit değişkenlerinin modellerin karar vermesinde öne çıktığı görülmektedir. Bu değişkenler, gruplar arasında istatistiksel olarak anlamlı düzeyde farklı çıkan değişkenler arasında da yer almaktadır. Sonuç: Çalışmamızda yaş, etnik köken, sosyodemografik veriler, boy, kilo, tansiyon ölçümleri gibi klinik veriler ile tetkik sonuçları üzerinden, GDM tahminleme gücüne sahip ML modelleri geliştirilmiştir.

Özet (Çeviri)

Research Question: Gestational diabetes mellitus (GDM), also known as pregnancy diabetes, is a condition characterized by high blood sugar that is first detected or starts during pregnancy, adversely affecting the health of both mother and baby. The diagnosis of GDM is made during the 6th to 7th months of pregnancy through the Oral Glucose Tolerance Test (OGTT), which involves the pregnant woman consuming a sugar-containing solution. The refusal to take the test due to intolerance or fear of harming the baby is on the rise. This study aims to predict GDM using machine learning (ML) models and to assess the predictive power of these models. Method: Between October 2022 and July 2023, a survey was conducted on 364 pregnant women who visited a Women's Diseases and Maternity Hospital for the OGTT. The survey collected data on age, socioeconomic status, immigration status, education level, substance use including tobacco and alcohol, history of delivering large babies, personal and family history of diabetes, pre-pregnancy illnesses, height, weight, and blood pressure. Laboratory test results were also obtained from patient records. The dataset was analyzed using the Python programming language in a Jupyter Notebook interface, developing CatBoost and LightGBM ML classifier algorithms. Model performances were determined using performance metrics, and the models' explainability was evaluated using SHAP analyses and“feature importance”methods. Findings: Model training and validation were carried out using K-fold cross-validation. The performance metrics of the LGBM and CatBoost ML models were found to be similar. Although the CatBoost model had a lower accuracy percentage compared to LGBM, it showed a higher AUC in ROC analysis. The SHAP analyses of both ML models indicated that body mass index, current weight, age, and erythrocyte variables were significant in decision-making. These variables also appeared statistically significant among the variables differentiating between groups. Conclusion: Our study developed ML models capable of predicting GDM based on clinical data such as age, ethnicity, sociodemographic data, height, weight, and blood pressure measurements, along with test results.

Benzer Tezler

  1. Yazılı para transferi talimatları üzerinden bilgi çıkarımı

    Information extraction from written money transfer orders

    BERKE ORAL

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    Bankacılıkİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. GÜLŞEN ERYİĞİT

  2. Makine öğrenmesi yöntemleriyle demografik veriler üzerinden yabancı dil seviyesi tahmini

    Prediction of foreign language proficiency via machine learning methods using demographic data

    GONCA GÜL DUMAN ORAL

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Endüstri ve Endüstri MühendisliğiYıldız Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    PROF. DR. SELİN SONER KARA

  3. Derin topluluk öğrenmesi modeli ile histopatolojik görüntüler üzerinde çok sınıflı kanser teşhisi

    Multi-class cancer diagnosis on histopathological images with deep ensemble learning model

    GİZEM YILDIZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKocaeli Üniversitesi

    Bilişim Sistemleri Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ÖNDER YAKUT

  4. Exploring opinions of corporate instructional designers on their professional development and training needs

    Kurumsal öğretim tasarımcılarının mesleki gelişim ve eğitim ihtiyaçları konusundaki görüşlerinin araştırılması

    NAZLI GÖKALP

    Yüksek Lisans

    İngilizce

    İngilizce

    2025

    Eğitim ve ÖğretimOrta Doğu Teknik Üniversitesi

    Eğitim Programları ve Öğretimi Ana Bilim Dalı

    DR. ELİF ÖZTÜRK

  5. Therapeutic planning based on the storytelling of individual traumas: Narratives from veddel neighbourhood

    Bireysel travmaların hikaye anlatımına dayalı terapötik planlama: Veddel mahallesinden anlatımlar

    AMIRHOSSEIN ETEMADI

    Doktora

    İngilizce

    İngilizce

    2023

    Şehircilik ve Bölge Planlamaİstanbul Teknik Üniversitesi

    Şehir ve Bölge Planlama Ana Bilim Dalı

    DOÇ. DR. EDA BEYAZIT İNCE