İstanbul'da tedavi görmüş diyabet hastalarına ait sağlık kayıtlarının büyük veri teknikleri ile incelenmesi
Analysis of health records of diabetes patients treated in İstanbul with big data techniques
- Tez No: 734252
- Danışmanlar: DOÇ. DR. KEMAL HAKAN GÜLKESEN
- Tez Türü: Doktora
- Konular: Endokrinoloji ve Metabolizma Hastalıkları, Endocrinology and Metabolic Diseases
- Anahtar Kelimeler: diyabetes mellitus, büyük veri, makine öğrenmesi, epidemiyoloji, diabetes mellitus, big data, machine learning, epidemiology
- Yıl: 2022
- Dil: Türkçe
- Üniversite: Akdeniz Üniversitesi
- Enstitü: Sağlık Bilimleri Enstitüsü
- Ana Bilim Dalı: Biyoistatistik ve Tıbbi Bilişim Ana Bilim Dalı
- Bilim Dalı: Biyoistatistik ve Tıp Bilişimi Bilim Dalı
- Sayfa Sayısı: 274
Özet
Amaç: Çalışmamızda, Türkiye'de ve spesifik olarak İstanbul'da diyabetin prevalansını, Türkiye genelinde diyabetlilerdeki belli başlı komorbiditeleri araştırmayı ayrıca, İstanbul'da tedavi görenlerde makine öğrenmesi yöntemleri ile kan şekeri kontrolünü tahmin eden model geliştirmeyi amaçladık. Yöntem: T.C. Sağlık Bakanlığı'nın kişisel sağlık kaydı sistemi e-Nabız'dır. Sistemdeki veriler de-identifiye edilmiş olarak Hadoop temelli büyük veri ortamı Cloudera (CDH, v. 6.3.2)'ya aktarılmaktadır. Sorgulamalar Cloudera'da Apache Impala (v. 3.2.0) ile yapılmıştır. İstanbul'da 2017 yılında diyabet tanısı konan vakaların 2020 yılına kadar olan verilerini inceledik. Yılda en az bir HbA1c değeri olanlardan son iki HbA1c değeri 7'nin altındakileri kontrol altında kan şekeri, diğerlerini kontrol altına alınamayan kan şekeri olarak grupladık. Grubu tahmin edebilecek modeller tasarlamak için İkili Lojistik Regresyon (LR), Çok Katmanlı Tam Bağlantılı Sinir Ağı (MLP), Rastgele Orman (RO) ve eXtreme Gradient Boost (XGBoost, XGB) kullandık. MLP ve RO, scikit-learn python kitaplığına dayanıyordu. XGBoost'un scikit-learn uyumlu API'si kullanıldı. LR, Jamovi v2.2.5 yazılımı ile yapıldı. Makine öğrenimi algoritmalarının performansını değerlendirmek için eğri altında kalan alan (%95 Güven Aralığı), duyarlılık, seçicilik, kesinlik, F1 puanı ve doğruluk kullanıldı. Bulgular: Türkiye genelinde 2020 yılı sonunda kadınlarda %13,10; erkeklerde %9,12 olmak üzere diyabetli oranı %11,12 (7.178.674 kişi), İstanbul'da %9,77'dir. 2019'da kişi başına yaşa göre ağırlıklı hekim başvurusu diyabetliler için 15,5; Diyabetli olmayanlar için 9,5; Diyabetliler için reçete sayısı 7,9; Olmayanlar için 4,5'tir. Antidiyabetik içeren ortalama reçete sayısı 2,88'dir. Yeterli verisi olan 77.724 diyabet kaydından 28.791 (%37)'sinde kan şekeri kontrol altındadır. Modellerden XGB 0,895 ROC AUC ve 0,890-0,899 güven aralığı ile en başarılı yöntem olarak tesbit edildi. LR, MLP, RO yöntemleri sırası ile 0,889 (0,883-0,894); 0,887 (0,884- 0,892); 0,878 (0,873-0,883) sonuçlarını verdi. Sonuç: Ulusal elektronik sağlık kayıtlarının diyabet ve pek çok sağlık probleminde önemli bilgiler sağlayabileceği görülmüştür. Kan şekeri kontrolünü tahmininde en başarılı yöntemin XGB olduğu, diğer yöntemlerin de tatmin edici sonuçlar verdiği görülmektedir.
Özet (Çeviri)
Objective: In our study, we aimed to investigate the prevalence of diabetes in Turkey and specifically in Istanbul, the main comorbidities in patients with diabetes throughout Turkey, and also to develop a model that predicts blood sugar control in those receiving treatment in Istanbul using machine learning methods. Method: The PHR system of the Ministry of Health of Turkey is e-Nabız. The data in the system is transferred to the Hadoop-based big data environment Cloudera (CDH, v.6.3.2) as de-identified. Queries were made on Cloudera with Apache Impala (v.3.2.0). We analyzed the data of cases diagnosed with diabetes in Istanbul in 2017 until 2020. Among those with at least one HbA1c value per year, the last two HbA1c values below 7 were grouped as controlled blood sugar and the others as uncontrolled blood sugar. We used Binary Logistic Regression(LR), Multilayer Fully Connected Neural Network(MLP), Random Forest(RF), and eXtreme Gradient Boost(XGB) to design models that can predict the group. Area under the curve (95% CI), sensitivity, selectivity, precision, F1 score, and accuracy were used to evaluate the performance of machine learning algorithms. Results: At the end of 2020 in Turkey, the prevalance of diabetic patients was 11.12% and 9.77% in Istanbul. In 2019, the number of age-weighted physician admissions per capita was 15.5 for diabetics, 9.5 for non-diabetics, and the number of prescriptions per capita was 7.9 for diabetics, and 4.5 for non-diabetics. Of the 77,724 diabetes records with sufficient data, 28,791 (37%) had blood sugar under control. Among the models, XGB was determined as the most successful method with 0.895 ROC AUC and 0.890-0.899 CI. LR, MLP, RF methods gave the results 0.889 (0.883-0.894); 0.887 (0.884- 0.892); 0.878 (0.873-0.883), respectively. Conclusion: It was seen that national electronic health records can provide important information on diabetes and many health problems. It is seen that the most successful method in estimating blood sugar control is XGB, and other methods also give satisfactory results.
Benzer Tezler
- Factors affecting adherence among type 2 diabetes mellitus cases and prioritization of patient healthcare in pharmaceutical marketing activities
Tip 2 diyabetes mellitus olgularında tedaviye uyumu etkileyen faktörler ve ilaç endüstrisi pazarlama etkinliklerinde hasta sağlığının önceliklendirilmesi
MÜGE GİZEM BIÇAKÇI AKALIN
Doktora
İngilizce
2017
İşletmeİstanbul Bilgi Üniversitesiİşletme Yönetimi ve Organizasyon Ana Bilim Dalı
PROF. DR. SELİME SEZGİN
- Diyabetik ayak tedavisinde hiperbarik oksijen tedavisinin etkinliği
Başlık çevirisi yok
DOĞU ÇANKAYA
Tıpta Uzmanlık
Türkçe
1997
Deniz ve Sualtı Hekimliğiİstanbul ÜniversitesiDeniz ve Sualtı Hekimliği Ana Bilim Dalı
- Nonalkolik steatohepatit tedavisinde N-acetylcysteine
N-acetylcysteine in treatment of nonalcoholic steatohepatitis
GÜLSÜM EMEL PAMUK (ÖZTEKİN)
Tıpta Uzmanlık
Türkçe
2000
Endokrinoloji ve Metabolizma Hastalıklarıİstanbul Üniversitesiİç Hastalıkları Ana Bilim Dalı
PROF. DR. ABDULLAH SONSUZ
- Design of electrospun cardiovascular bypass graft using derivative of poly (Alkylene terephthalate)
Poli (Alkilen tereftalat) türevi kullanılarak elektro eğrilmiş kardiyovasküler baypas greft tasarımı
BERNA ŞENSU
Yüksek Lisans
İngilizce
2020
Tekstil ve Tekstil Mühendisliğiİstanbul Teknik ÜniversitesiTekstil Mühendisliği Ana Bilim Dalı
PROF. DR. HALE KARAKAŞ
- 1978-1988 yılları arasında İstanbul Tıp Fakültesi Dahiliye Anabilim Dalı'nda yatarak tedavi gören diabetus mellituslu olguların istatiksel analizi
Başlık çevirisi yok
HAYRİYE VEHİD(ERTEM)
Yüksek Lisans
Türkçe
1990
Endokrinoloji ve Metabolizma Hastalıklarıİstanbul ÜniversitesiPROF.DR. YAKUT ÖZDEN(IRMAK)