Makine öğrenmesi modelleri kullanılarak oral glukoz tolerans testi (OGTT) uygulanmadan glukoz intoleransının tahminlenmesi
Prediction of glucose intolerance without oral glucose tolerance test (OGTT) using machine learning models
- Tez No: 857423
- Danışmanlar: PROF. DR. İPEK DEVECİ KOCAKOÇ
- Tez Türü: Yüksek Lisans
- Konular: Ekonometri, Econometrics
- Anahtar Kelimeler: Gestasyonel diyabetes mellitus, oral glukoz tolerans testi, makine öğrenmesi, Gestational diabetes mellitus, oral glucose tolerance test, machine learning
- Yıl: 2024
- Dil: Türkçe
- Üniversite: Dokuz Eylül Üniversitesi
- Enstitü: Sosyal Bilimler Enstitüsü
- Ana Bilim Dalı: Ekonometri Ana Bilim Dalı
- Bilim Dalı: Veri Yönetimi ve Analizi Bilim Dalı
- Sayfa Sayısı: 96
Özet
Araştırma sorusu: Gebelik şekeri olarak da bilinen gestasyonel diyabet mellitus (GDM), ilk kez gebelik sırasında saptanan veya başlayan, anne ve bebek sağlığını olumsuz etkileyen yüksek kan şekeri ile karakterize bir hastalıktır. GDM tanısı hamileliğin 6-7. aylarında şeker içeren solüsyonların gebeye içirilmesi (Oral Glukoz Tolerans Testi (OGTT)) ile konulur. Testin tolere edilememesi ya da bebeğe zarar vereceği düşüncesiyle reddi giderek artmaktadır. Makine öğrenmesi (ML) modelleri kullanılarak GDM tahmini yapılması ve tahmin gücünün değerlendirilmesi amaçlanmıştır. Yöntem: Ekim 2022-Temmuz 2023 tarihlerinde OGTT için Kadın Hastalıkları ve Doğum Hastanesine başvuran 364 gebede yaş, sosyoekonomik, göçmenlik durumu, eğitim düzeyi, sosyoekonomik düzey, sigara/alkol/madde kullanımı, iri bebek doğum öyküsü, GDM öyküsü, ailede DM öyküsü, gebelik öncesi geçirilen hastalıklar, boy, kilo, kan basıncı bilgileri anket usulü ile laboratuvar test sonuçları hasta kayıtlarından alınmıştır. Oluşturulan veri setinde Python dili kullanılarak Jupyter Notebook arayüzünde CatBoost ve LightGBM ML sınıflayıcı algoritmaları geliştirilmiştir. Performans metrikleri ile model performansları belirlenmiştir. Modellerin açıklanabilirlik analizleri SHAP ve“feature importance”yöntemleriyle değerlendirilmiştir. Bulgular: K-katlamalı çapraz doğrulama yönteminden faydalanılarak model eğitimi ve doğrulaması gerçekleştirilmiştir. LGBM ve CatBoost ML modellerinin performans metrikleri benzer bulunmuştur. Doğruluk metriğinde CatBoost modelinin doğruluk yüzdesi LGBM'den düşük olmasına rağmen, ROC analizinde AUC'u daha yüksek bulunmuştur. Her iki ML modelinin SHAP analizleri karşılaştırıldığında vücut kitle indeksi, mevcut kilo, yaş ve eritrosit değişkenlerinin modellerin karar vermesinde öne çıktığı görülmektedir. Bu değişkenler, gruplar arasında istatistiksel olarak anlamlı düzeyde farklı çıkan değişkenler arasında da yer almaktadır. Sonuç: Çalışmamızda yaş, etnik köken, sosyodemografik veriler, boy, kilo, tansiyon ölçümleri gibi klinik veriler ile tetkik sonuçları üzerinden, GDM tahminleme gücüne sahip ML modelleri geliştirilmiştir.
Özet (Çeviri)
Research Question: Gestational diabetes mellitus (GDM), also known as pregnancy diabetes, is a condition characterized by high blood sugar that is first detected or starts during pregnancy, adversely affecting the health of both mother and baby. The diagnosis of GDM is made during the 6th to 7th months of pregnancy through the Oral Glucose Tolerance Test (OGTT), which involves the pregnant woman consuming a sugar-containing solution. The refusal to take the test due to intolerance or fear of harming the baby is on the rise. This study aims to predict GDM using machine learning (ML) models and to assess the predictive power of these models. Method: Between October 2022 and July 2023, a survey was conducted on 364 pregnant women who visited a Women's Diseases and Maternity Hospital for the OGTT. The survey collected data on age, socioeconomic status, immigration status, education level, substance use including tobacco and alcohol, history of delivering large babies, personal and family history of diabetes, pre-pregnancy illnesses, height, weight, and blood pressure. Laboratory test results were also obtained from patient records. The dataset was analyzed using the Python programming language in a Jupyter Notebook interface, developing CatBoost and LightGBM ML classifier algorithms. Model performances were determined using performance metrics, and the models' explainability was evaluated using SHAP analyses and“feature importance”methods. Findings: Model training and validation were carried out using K-fold cross-validation. The performance metrics of the LGBM and CatBoost ML models were found to be similar. Although the CatBoost model had a lower accuracy percentage compared to LGBM, it showed a higher AUC in ROC analysis. The SHAP analyses of both ML models indicated that body mass index, current weight, age, and erythrocyte variables were significant in decision-making. These variables also appeared statistically significant among the variables differentiating between groups. Conclusion: Our study developed ML models capable of predicting GDM based on clinical data such as age, ethnicity, sociodemographic data, height, weight, and blood pressure measurements, along with test results.
Benzer Tezler
- Yazılı para transferi talimatları üzerinden bilgi çıkarımı
Information extraction from written money transfer orders
BERKE ORAL
Yüksek Lisans
Türkçe
2021
Bankacılıkİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. GÜLŞEN ERYİĞİT
- Makine öğrenmesi yöntemleriyle demografik veriler üzerinden yabancı dil seviyesi tahmini
Prediction of foreign language proficiency via machine learning methods using demographic data
GONCA GÜL DUMAN ORAL
Yüksek Lisans
Türkçe
2024
Endüstri ve Endüstri MühendisliğiYıldız Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
PROF. DR. SELİN SONER KARA
- Derin topluluk öğrenmesi modeli ile histopatolojik görüntüler üzerinde çok sınıflı kanser teşhisi
Multi-class cancer diagnosis on histopathological images with deep ensemble learning model
GİZEM YILDIZ
Yüksek Lisans
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKocaeli ÜniversitesiBilişim Sistemleri Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ÖNDER YAKUT
- Exploring opinions of corporate instructional designers on their professional development and training needs
Kurumsal öğretim tasarımcılarının mesleki gelişim ve eğitim ihtiyaçları konusundaki görüşlerinin araştırılması
NAZLI GÖKALP
Yüksek Lisans
İngilizce
2025
Eğitim ve ÖğretimOrta Doğu Teknik ÜniversitesiEğitim Programları ve Öğretimi Ana Bilim Dalı
DR. ELİF ÖZTÜRK
- Therapeutic planning based on the storytelling of individual traumas: Narratives from veddel neighbourhood
Bireysel travmaların hikaye anlatımına dayalı terapötik planlama: Veddel mahallesinden anlatımlar
AMIRHOSSEIN ETEMADI
Doktora
İngilizce
2023
Şehircilik ve Bölge Planlamaİstanbul Teknik ÜniversitesiŞehir ve Bölge Planlama Ana Bilim Dalı
DOÇ. DR. EDA BEYAZIT İNCE