Geri Dön

İstanbul'da tedavi görmüş diyabet hastalarına ait sağlık kayıtlarının büyük veri teknikleri ile incelenmesi

Analysis of health records of diabetes patients treated in İstanbul with big data techniques

  1. Tez No: 734252
  2. Yazar: MUSTAFA MAHİR ÜLGÜ
  3. Danışmanlar: DOÇ. DR. KEMAL HAKAN GÜLKESEN
  4. Tez Türü: Doktora
  5. Konular: Endokrinoloji ve Metabolizma Hastalıkları, Endocrinology and Metabolic Diseases
  6. Anahtar Kelimeler: diyabetes mellitus, büyük veri, makine öğrenmesi, epidemiyoloji, diabetes mellitus, big data, machine learning, epidemiology
  7. Yıl: 2022
  8. Dil: Türkçe
  9. Üniversite: Akdeniz Üniversitesi
  10. Enstitü: Sağlık Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Biyoistatistik ve Tıbbi Bilişim Ana Bilim Dalı
  12. Bilim Dalı: Biyoistatistik ve Tıp Bilişimi Bilim Dalı
  13. Sayfa Sayısı: 274

Özet

Amaç: Çalışmamızda, Türkiye'de ve spesifik olarak İstanbul'da diyabetin prevalansını, Türkiye genelinde diyabetlilerdeki belli başlı komorbiditeleri araştırmayı ayrıca, İstanbul'da tedavi görenlerde makine öğrenmesi yöntemleri ile kan şekeri kontrolünü tahmin eden model geliştirmeyi amaçladık. Yöntem: T.C. Sağlık Bakanlığı'nın kişisel sağlık kaydı sistemi e-Nabız'dır. Sistemdeki veriler de-identifiye edilmiş olarak Hadoop temelli büyük veri ortamı Cloudera (CDH, v. 6.3.2)'ya aktarılmaktadır. Sorgulamalar Cloudera'da Apache Impala (v. 3.2.0) ile yapılmıştır. İstanbul'da 2017 yılında diyabet tanısı konan vakaların 2020 yılına kadar olan verilerini inceledik. Yılda en az bir HbA1c değeri olanlardan son iki HbA1c değeri 7'nin altındakileri kontrol altında kan şekeri, diğerlerini kontrol altına alınamayan kan şekeri olarak grupladık. Grubu tahmin edebilecek modeller tasarlamak için İkili Lojistik Regresyon (LR), Çok Katmanlı Tam Bağlantılı Sinir Ağı (MLP), Rastgele Orman (RO) ve eXtreme Gradient Boost (XGBoost, XGB) kullandık. MLP ve RO, scikit-learn python kitaplığına dayanıyordu. XGBoost'un scikit-learn uyumlu API'si kullanıldı. LR, Jamovi v2.2.5 yazılımı ile yapıldı. Makine öğrenimi algoritmalarının performansını değerlendirmek için eğri altında kalan alan (%95 Güven Aralığı), duyarlılık, seçicilik, kesinlik, F1 puanı ve doğruluk kullanıldı. Bulgular: Türkiye genelinde 2020 yılı sonunda kadınlarda %13,10; erkeklerde %9,12 olmak üzere diyabetli oranı %11,12 (7.178.674 kişi), İstanbul'da %9,77'dir. 2019'da kişi başına yaşa göre ağırlıklı hekim başvurusu diyabetliler için 15,5; Diyabetli olmayanlar için 9,5; Diyabetliler için reçete sayısı 7,9; Olmayanlar için 4,5'tir. Antidiyabetik içeren ortalama reçete sayısı 2,88'dir. Yeterli verisi olan 77.724 diyabet kaydından 28.791 (%37)'sinde kan şekeri kontrol altındadır. Modellerden XGB 0,895 ROC AUC ve 0,890-0,899 güven aralığı ile en başarılı yöntem olarak tesbit edildi. LR, MLP, RO yöntemleri sırası ile 0,889 (0,883-0,894); 0,887 (0,884- 0,892); 0,878 (0,873-0,883) sonuçlarını verdi. Sonuç: Ulusal elektronik sağlık kayıtlarının diyabet ve pek çok sağlık probleminde önemli bilgiler sağlayabileceği görülmüştür. Kan şekeri kontrolünü tahmininde en başarılı yöntemin XGB olduğu, diğer yöntemlerin de tatmin edici sonuçlar verdiği görülmektedir.

Özet (Çeviri)

Objective: In our study, we aimed to investigate the prevalence of diabetes in Turkey and specifically in Istanbul, the main comorbidities in patients with diabetes throughout Turkey, and also to develop a model that predicts blood sugar control in those receiving treatment in Istanbul using machine learning methods. Method: The PHR system of the Ministry of Health of Turkey is e-Nabız. The data in the system is transferred to the Hadoop-based big data environment Cloudera (CDH, v.6.3.2) as de-identified. Queries were made on Cloudera with Apache Impala (v.3.2.0). We analyzed the data of cases diagnosed with diabetes in Istanbul in 2017 until 2020. Among those with at least one HbA1c value per year, the last two HbA1c values below 7 were grouped as controlled blood sugar and the others as uncontrolled blood sugar. We used Binary Logistic Regression(LR), Multilayer Fully Connected Neural Network(MLP), Random Forest(RF), and eXtreme Gradient Boost(XGB) to design models that can predict the group. Area under the curve (95% CI), sensitivity, selectivity, precision, F1 score, and accuracy were used to evaluate the performance of machine learning algorithms. Results: At the end of 2020 in Turkey, the prevalance of diabetic patients was 11.12% and 9.77% in Istanbul. In 2019, the number of age-weighted physician admissions per capita was 15.5 for diabetics, 9.5 for non-diabetics, and the number of prescriptions per capita was 7.9 for diabetics, and 4.5 for non-diabetics. Of the 77,724 diabetes records with sufficient data, 28,791 (37%) had blood sugar under control. Among the models, XGB was determined as the most successful method with 0.895 ROC AUC and 0.890-0.899 CI. LR, MLP, RF methods gave the results 0.889 (0.883-0.894); 0.887 (0.884- 0.892); 0.878 (0.873-0.883), respectively. Conclusion: It was seen that national electronic health records can provide important information on diabetes and many health problems. It is seen that the most successful method in estimating blood sugar control is XGB, and other methods also give satisfactory results.

Benzer Tezler

  1. Factors affecting adherence among type 2 diabetes mellitus cases and prioritization of patient healthcare in pharmaceutical marketing activities

    Tip 2 diyabetes mellitus olgularında tedaviye uyumu etkileyen faktörler ve ilaç endüstrisi pazarlama etkinliklerinde hasta sağlığının önceliklendirilmesi

    MÜGE GİZEM BIÇAKÇI AKALIN

    Doktora

    İngilizce

    İngilizce

    2017

    İşletmeİstanbul Bilgi Üniversitesi

    İşletme Yönetimi ve Organizasyon Ana Bilim Dalı

    PROF. DR. SELİME SEZGİN

  2. Diyabetik ayak tedavisinde hiperbarik oksijen tedavisinin etkinliği

    Başlık çevirisi yok

    DOĞU ÇANKAYA

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    1997

    Deniz ve Sualtı Hekimliğiİstanbul Üniversitesi

    Deniz ve Sualtı Hekimliği Ana Bilim Dalı

  3. Nonalkolik steatohepatit tedavisinde N-acetylcysteine

    N-acetylcysteine in treatment of nonalcoholic steatohepatitis

    GÜLSÜM EMEL PAMUK (ÖZTEKİN)

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2000

    Endokrinoloji ve Metabolizma Hastalıklarıİstanbul Üniversitesi

    İç Hastalıkları Ana Bilim Dalı

    PROF. DR. ABDULLAH SONSUZ

  4. Design of electrospun cardiovascular bypass graft using derivative of poly (Alkylene terephthalate)

    Poli (Alkilen tereftalat) türevi kullanılarak elektro eğrilmiş kardiyovasküler baypas greft tasarımı

    BERNA ŞENSU

    Yüksek Lisans

    İngilizce

    İngilizce

    2020

    Tekstil ve Tekstil Mühendisliğiİstanbul Teknik Üniversitesi

    Tekstil Mühendisliği Ana Bilim Dalı

    PROF. DR. HALE KARAKAŞ