Tip 2 diyabet hastalığında fenotip verilerinin makine öğrenmesi algoritmaları ile incelenmesi
Investigation of phenotype data with machine learning algorithms in Type 2 diabetes disease.
- Tez No: 893910
- Danışmanlar: PROF. DR. FIRAT HARDALAÇ
- Tez Türü: Yüksek Lisans
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: Türkçe
- Üniversite: Gazi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Elektrik Elektronik Mühendisliği Bilim Dalı
- Sayfa Sayısı: 94
Özet
Makine öğrenmesi (MÖ) ile fenotipik veriler kullanarak Tip 2 Diyabet'in (T2DM) tahmini büyük ilgi görmektedir. PyCaret, birden fazla MÖ modelinin eş zamanlı yürütülmesine olanak tanıyan, az kodlama gerektiren ve az yazılım bilgisi gerektiren bir makine öğrenmesi çerçevesidir.“Hemşire Sağlık Çalışması”ve“Sağlık Profesyonelleri Takip Çalışması”veri setleri analiz için kullanılmıştır. Veri setleri, 14 (cinsiyet dahil 15) fenotipik değişkene sahip 5 672 kişiyi içermektedir. Modeller, doğruluk, eğri altındaki alan (AUC), geri çağırma, kesinlik, F1 puanı, kappa, Matthews Korelasyon Katsayısı ve Cohen'in kappa puanına göre değerlendirilmiştir. Erkeklerde Ridge Sınıflandırıcı, Doğrusal Diskriminant Analizi (LDA) ve Lojistik Regresyon (LR); kadınlarda ise LR, Ridge Sınıflandırıcı ve LDA en iyi modellerdi. Tüm veri seti için LR, Gradient Boosting Sınıflandırıcı (GBC) ve CatBoost Sınıflandırıcı benzer yüksek performans puanları elde etti. AUC, doğruluk ve kesinlik yaklaşık olarak sırasıyla erkekler için 0,77; 0,70 ve 0,70; kadınlar için 0,79; 0,70 ve 0,71; toplam veri seti için ise 0,79; 0,72 ve 0,72 olarak bulundu. Özellik önemi grafiği, kadınlar için ailesel diyabet hikayesi (famdb), sigara içmeme durumu ve hipertansiyonun en önemli özellikler olduğunu gösterirken, erkeklerde famdb, hipertansiyon ve halen sigara içiyor olma en önemli değişkenlerdir. Toplam veri setinde cinsiyetin model oluşumuna orta derecede etkisi gözlemlenmiş ve tahminde önemli bir değişken olabileceği değerlendirilmiştir. SHAP grafiğinde, kadınlarda alkol, hiç sigara içmemiş olma, düşük çoklu doymamış yağ ve tahıl lifi alımı ile diyabet riski azalmış; diğer değişkenlerin ise yüksek değerlerinde diyabet riski artarken; aktivite, demir ve magnezyum alımının diyabet üzerine etkisinin az veya hiç olmadığı görülmüştür. Erkeklerde ise alkol, aktivite, hiç sigara içmemiş olma, düşük trans yağ ve tahıl lifi alımı ile diyabet riski azalmış; glisemik yük ve magnezyum alımının diyabet üzerine etkisi az veya yoktur. Toplam veri setinde, tahıl lifi ve çoklu doymamış yağ alımının etkileri azalmıştır. Düşük magnezyum seviyeleri ve yüksek trans yağ alımı ise diyabetle ilişkilendirilmiştir. Veriler birleştirildiğinde bazı özelliklerin gerçek etkileri maskelenebilir. PyCaret, fenotipik verilerle T2DM tahmini için başarıyla kullanılmıştır. Cinsiyet farklılıkları, T2DM tahmini için önemli bir değişkendir. Fenotipik değişkenler T2DM tahmini için yeterli olmayabilir; bu nedenle genotipik değişkenlerin de kullanılması önerilir.
Özet (Çeviri)
Predicting type 2 diabetes mellitus (T2DM) using phenotypic data with machine learning (ML) techniques has gained significant attention in recent years. PyCaret is a low-code and fast framework that enables the concurrent execution of multiple ML models with little expertise. The Nurses' Health Study and Health Professionals Follow-up Study datasets, including 5,672 individuals with 14 phenotypic variables (15 including gender), were used. Models were evaluated based on accuracy, AUC, recall, precision, F1-score, Kappa, Matthews Correlation Coefficient, and Cohen's Kappa score. Ridge Classifier, Linear Discriminant Analysis (LDA), and Logistic Regression (LR) were the best-performing models in men, while Gradient Boosting Classifier and CatBoost Classifier were the best models in women. LR, Gradient Boosting Classifier, and CatBoost Classifier achieved similarly high performance scores for the entire dataset. The AUC, accuracy, and precision were approximately 0.77, 0.70, and 0.70 for males; 0.79, 0.70, and 0.71 for females; and 0.79, 0.72, and 0.72 for the total dataset, respectively. Family history of diabetes (famdb), never being a smoker, and hypertension were the most influential features in females, while famdb, hypertension, and currently being a smoker were the key variables in males, according to the feature importance plot. Gender had a moderate effect on model formation in the entire dataset. While higher values of certain features were associated with diabetes, lower values of alcohol intake, never being smoked, polyunsaturated fat, and cereal fiber intake were linked to diabetes in females, according to SHAP analysis. In contrast, activity, heme, and magnesium intake appeared to have little or no effect on diabetes in the current dataset. In males, higher values of most features favored diabetes, while lower values of alcohol intake, activity, never being smoked, trans fat, and cereal fiber intake were associated with diabetes. Glycemic load and magnesium intake seemed to have little or no effect on diabetes in this dataset. When combining the male and female data, the effects of cereal fiber and polyunsaturated fat intake diminished in the prediction. Lower levels of magnesium and higher trans fat intake were associated with diabetes. Combining male and female data can mask the true effect of some features. PyCaret was successfully used for the prediction of T2DM. Despite the effectiveness of this comprehensive ML tool, phenotypic variables alone may not be sufficient for early T2DM prediction; incorporating genotypic variables could enhance future studies.
Benzer Tezler
- Tip 2 diyabetes mellitus hastalarında diyabet regülasyonu ve diyabet yaşı ile hastanın kırılganlığının bir göstergesi olan yürüme hızı arasındaki ilişki
The relationship of walking speed as an indicator of frai̇lty in TYPE 2 diabetes mellitus patients with diabetes regulation and age of diabetes
SÜMEYYE KARASAKAL
Tıpta Uzmanlık
Türkçe
2021
Aile HekimliğiSağlık Bilimleri ÜniversitesiAile Hekimliği Ana Bilim Dalı
DOÇ. DR. ESMA GÜLDAL ALTUNOĞLU
- Alkolik olmayan yağlı karaciğer hastalığında hipertrigliseridemik bel fenotipi ile karotid ateroskleroz arasındaki ilişkinin araştırılması
The association of hypertriglyceridemic waist phenotype and carotid atherosclerosis in subjects with non-alcoholic faty liver diasese
HALİL GENÇ
Tıpta Yan Dal Uzmanlık
Türkçe
2013
GastroenterolojiGATAGastroenteroloji Ana Bilim Dalı
PROF. DR. MUSTAFA GÜLŞEN
- Tip 2 diyabet hastalarında Rev-erb beta gen dizisindeki varyasyonların klinik fenotiple ilişkilerinin araştırılması
Investigation of associations of Rev-erb beta gene variations with clinical phenotype in patients with type 2 diabetes
BENGÜ TOKAT
Doktora
Türkçe
2018
Endokrinoloji ve Metabolizma Hastalıklarıİstanbul ÜniversitesiMoleküler Tıp Ana Bilim Dalı
PROF. DR. HÜLYA YILMAZ AYDOĞAN
- Tip 2 diabetes mellitus hastalarında PPAR? geninin MLPA (Multıplex Lıgatıon-Dependent Probe Amplıfıcatıon) yöntemi ile genetik analizi
Genetic analysis of PPAR? gene by using MLPA (Multıplex Lıgatıon-Dependent Probe Amplıfıcatıon) technique in patients with type 2 diabetes mellitus
KADRİ MURAT ERDOĞAN
Tıpta Uzmanlık
Türkçe
2009
Endokrinoloji ve Metabolizma HastalıklarıPamukkale ÜniversitesiTıbbi Genetik Ana Bilim Dalı
DOÇ. DR. FÜSUN DÜZCAN
- Sistayonin beta-sentaz eksikliğine bağlı homosistinüri hastalarında klinik, biyokoimyasal ve moleküler bulguların belgelenmesi, genotip-fenotip ilişkisinin araştırılması
Documentation of the clinical, biochemical, molecular findings and investigation of genotype-phenotype correlations in patients with homocystinuria due to cystathionine beta-synthase deficiency
BURCU ÖZTÜRK HİŞMİ
Tıpta Yan Dal Uzmanlık
Türkçe
2013
Çocuk Sağlığı ve HastalıklarıHacettepe ÜniversitesiÇocuk Sağlığı ve Hastalıkları Ana Bilim Dalı
PROF. DR. ALİ DURSUN