Geri Dön

Tip 2 diyabet hastalığında fenotip verilerinin makine öğrenmesi algoritmaları ile incelenmesi

Investigation of phenotype data with machine learning algorithms in Type 2 diabetes disease.

  1. Tez No: 893910
  2. Yazar: ŞEBNEM GÜL
  3. Danışmanlar: PROF. DR. FIRAT HARDALAÇ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: Türkçe
  9. Üniversite: Gazi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Elektrik Elektronik Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 94

Özet

Makine öğrenmesi (MÖ) ile fenotipik veriler kullanarak Tip 2 Diyabet'in (T2DM) tahmini büyük ilgi görmektedir. PyCaret, birden fazla MÖ modelinin eş zamanlı yürütülmesine olanak tanıyan, az kodlama gerektiren ve az yazılım bilgisi gerektiren bir makine öğrenmesi çerçevesidir.“Hemşire Sağlık Çalışması”ve“Sağlık Profesyonelleri Takip Çalışması”veri setleri analiz için kullanılmıştır. Veri setleri, 14 (cinsiyet dahil 15) fenotipik değişkene sahip 5 672 kişiyi içermektedir. Modeller, doğruluk, eğri altındaki alan (AUC), geri çağırma, kesinlik, F1 puanı, kappa, Matthews Korelasyon Katsayısı ve Cohen'in kappa puanına göre değerlendirilmiştir. Erkeklerde Ridge Sınıflandırıcı, Doğrusal Diskriminant Analizi (LDA) ve Lojistik Regresyon (LR); kadınlarda ise LR, Ridge Sınıflandırıcı ve LDA en iyi modellerdi. Tüm veri seti için LR, Gradient Boosting Sınıflandırıcı (GBC) ve CatBoost Sınıflandırıcı benzer yüksek performans puanları elde etti. AUC, doğruluk ve kesinlik yaklaşık olarak sırasıyla erkekler için 0,77; 0,70 ve 0,70; kadınlar için 0,79; 0,70 ve 0,71; toplam veri seti için ise 0,79; 0,72 ve 0,72 olarak bulundu. Özellik önemi grafiği, kadınlar için ailesel diyabet hikayesi (famdb), sigara içmeme durumu ve hipertansiyonun en önemli özellikler olduğunu gösterirken, erkeklerde famdb, hipertansiyon ve halen sigara içiyor olma en önemli değişkenlerdir. Toplam veri setinde cinsiyetin model oluşumuna orta derecede etkisi gözlemlenmiş ve tahminde önemli bir değişken olabileceği değerlendirilmiştir. SHAP grafiğinde, kadınlarda alkol, hiç sigara içmemiş olma, düşük çoklu doymamış yağ ve tahıl lifi alımı ile diyabet riski azalmış; diğer değişkenlerin ise yüksek değerlerinde diyabet riski artarken; aktivite, demir ve magnezyum alımının diyabet üzerine etkisinin az veya hiç olmadığı görülmüştür. Erkeklerde ise alkol, aktivite, hiç sigara içmemiş olma, düşük trans yağ ve tahıl lifi alımı ile diyabet riski azalmış; glisemik yük ve magnezyum alımının diyabet üzerine etkisi az veya yoktur. Toplam veri setinde, tahıl lifi ve çoklu doymamış yağ alımının etkileri azalmıştır. Düşük magnezyum seviyeleri ve yüksek trans yağ alımı ise diyabetle ilişkilendirilmiştir. Veriler birleştirildiğinde bazı özelliklerin gerçek etkileri maskelenebilir. PyCaret, fenotipik verilerle T2DM tahmini için başarıyla kullanılmıştır. Cinsiyet farklılıkları, T2DM tahmini için önemli bir değişkendir. Fenotipik değişkenler T2DM tahmini için yeterli olmayabilir; bu nedenle genotipik değişkenlerin de kullanılması önerilir.

Özet (Çeviri)

Predicting type 2 diabetes mellitus (T2DM) using phenotypic data with machine learning (ML) techniques has gained significant attention in recent years. PyCaret is a low-code and fast framework that enables the concurrent execution of multiple ML models with little expertise. The Nurses' Health Study and Health Professionals Follow-up Study datasets, including 5,672 individuals with 14 phenotypic variables (15 including gender), were used. Models were evaluated based on accuracy, AUC, recall, precision, F1-score, Kappa, Matthews Correlation Coefficient, and Cohen's Kappa score. Ridge Classifier, Linear Discriminant Analysis (LDA), and Logistic Regression (LR) were the best-performing models in men, while Gradient Boosting Classifier and CatBoost Classifier were the best models in women. LR, Gradient Boosting Classifier, and CatBoost Classifier achieved similarly high performance scores for the entire dataset. The AUC, accuracy, and precision were approximately 0.77, 0.70, and 0.70 for males; 0.79, 0.70, and 0.71 for females; and 0.79, 0.72, and 0.72 for the total dataset, respectively. Family history of diabetes (famdb), never being a smoker, and hypertension were the most influential features in females, while famdb, hypertension, and currently being a smoker were the key variables in males, according to the feature importance plot. Gender had a moderate effect on model formation in the entire dataset. While higher values of certain features were associated with diabetes, lower values of alcohol intake, never being smoked, polyunsaturated fat, and cereal fiber intake were linked to diabetes in females, according to SHAP analysis. In contrast, activity, heme, and magnesium intake appeared to have little or no effect on diabetes in the current dataset. In males, higher values of most features favored diabetes, while lower values of alcohol intake, activity, never being smoked, trans fat, and cereal fiber intake were associated with diabetes. Glycemic load and magnesium intake seemed to have little or no effect on diabetes in this dataset. When combining the male and female data, the effects of cereal fiber and polyunsaturated fat intake diminished in the prediction. Lower levels of magnesium and higher trans fat intake were associated with diabetes. Combining male and female data can mask the true effect of some features. PyCaret was successfully used for the prediction of T2DM. Despite the effectiveness of this comprehensive ML tool, phenotypic variables alone may not be sufficient for early T2DM prediction; incorporating genotypic variables could enhance future studies.

Benzer Tezler

  1. Tip 2 diyabetes mellitus hastalarında diyabet regülasyonu ve diyabet yaşı ile hastanın kırılganlığının bir göstergesi olan yürüme hızı arasındaki ilişki

    The relationship of walking speed as an indicator of frai̇lty in TYPE 2 diabetes mellitus patients with diabetes regulation and age of diabetes

    SÜMEYYE KARASAKAL

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2021

    Aile HekimliğiSağlık Bilimleri Üniversitesi

    Aile Hekimliği Ana Bilim Dalı

    DOÇ. DR. ESMA GÜLDAL ALTUNOĞLU

  2. Alkolik olmayan yağlı karaciğer hastalığında hipertrigliseridemik bel fenotipi ile karotid ateroskleroz arasındaki ilişkinin araştırılması

    The association of hypertriglyceridemic waist phenotype and carotid atherosclerosis in subjects with non-alcoholic faty liver diasese

    HALİL GENÇ

    Tıpta Yan Dal Uzmanlık

    Türkçe

    Türkçe

    2013

    GastroenterolojiGATA

    Gastroenteroloji Ana Bilim Dalı

    PROF. DR. MUSTAFA GÜLŞEN

  3. Tip 2 diyabet hastalarında Rev-erb beta gen dizisindeki varyasyonların klinik fenotiple ilişkilerinin araştırılması

    Investigation of associations of Rev-erb beta gene variations with clinical phenotype in patients with type 2 diabetes

    BENGÜ TOKAT

    Doktora

    Türkçe

    Türkçe

    2018

    Endokrinoloji ve Metabolizma Hastalıklarıİstanbul Üniversitesi

    Moleküler Tıp Ana Bilim Dalı

    PROF. DR. HÜLYA YILMAZ AYDOĞAN

  4. Tip 2 diabetes mellitus hastalarında PPAR? geninin MLPA (Multıplex Lıgatıon-Dependent Probe Amplıfıcatıon) yöntemi ile genetik analizi

    Genetic analysis of PPAR? gene by using MLPA (Multıplex Lıgatıon-Dependent Probe Amplıfıcatıon) technique in patients with type 2 diabetes mellitus

    KADRİ MURAT ERDOĞAN

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2009

    Endokrinoloji ve Metabolizma HastalıklarıPamukkale Üniversitesi

    Tıbbi Genetik Ana Bilim Dalı

    DOÇ. DR. FÜSUN DÜZCAN

  5. Sistayonin beta-sentaz eksikliğine bağlı homosistinüri hastalarında klinik, biyokoimyasal ve moleküler bulguların belgelenmesi, genotip-fenotip ilişkisinin araştırılması

    Documentation of the clinical, biochemical, molecular findings and investigation of genotype-phenotype correlations in patients with homocystinuria due to cystathionine beta-synthase deficiency

    BURCU ÖZTÜRK HİŞMİ

    Tıpta Yan Dal Uzmanlık

    Türkçe

    Türkçe

    2013

    Çocuk Sağlığı ve HastalıklarıHacettepe Üniversitesi

    Çocuk Sağlığı ve Hastalıkları Ana Bilim Dalı

    PROF. DR. ALİ DURSUN