Geri Dön

Mathematical model-based clinical decision support system algorithm design study that can support the diagnosis of celiac disease

Çölyak hastalığının teşhisine destek verebilecek matematik model tabanlı kds algoritması tasarımı

  1. Tez No: 898091
  2. Yazar: ELİF KESKİN BİLGİÇ
  3. Danışmanlar: DR. İNCİ ZAİM GÖKBAY, DOÇ. DR. YUSUF KAYAR
  4. Tez Türü: Doktora
  5. Konular: Mühendislik Bilimleri, Engineering Sciences
  6. Anahtar Kelimeler: Çölyak Hastalığı Teşhisi, Görüntü sınıflandırma, Derin ve makine öğrenimi, Transfer öğrenimi, VGG16 ve Mediapipe, Diagnosis of Celiac Disease, Face Image classification, Deep and machine learning, Transfer learning, Mediapipe (MobileNetV2), and VGG16
  7. Yıl: 2024
  8. Dil: İngilizce
  9. Üniversite: İstanbul Üniversitesi-Cerrahpaşa
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Biyomedikal Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Biyomedikal Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 128

Özet

Giriş: Çölyak hastalığı (ÇH), ince bağırsağı etkileyen, buğday, arpa ve çavdarda bulunan bir protein olan glutenin tüketilmesiyle tetiklenen bir otoimmün bozukluktur. ÇH'li bireyler gluten tüketimleri sonrası ince bağırsaklarının iç kısmının zarar görmesine bağlı olarak, çeşitli semptomlar ve potansiyel uzun vadeli komplikasyonlar yaşamalarına neden olan bağışıklık tepkisi yaşamaktadır. ÇH'nin kesin tanısı tipik olarak bağırsak hasarının boyutunu belirleyen, ince bağırsak biyopsisi ile yapılmaktadır. Çölyak tanısının koyulması, bazı klinik belirtileri ve semptomlarının diğer otoimmün hastalıklar ile örtüşmesi nedeniyle zordur. Erken teşhis, bağırsak geçirgenliğinin hızla artmasını önleyerek hastalığın şiddetli ilerlemesini önleyici niteliktedir. ÇH tanısında yaşanan zorlukların üstesinden gelmek ve hastaların en kısa sürede uzmana ulaşmalarını sağlamak amacıyla teşhise destek verebilecek nitelikte sistemlerin geliştirilmesi gelişen teknolojinin de yardımıyla gittikçe önemli hale gelmektedir. Yapılan araştırmalar, video kapsül görüntü işleme alanında bağırsak epiteli deformasyonuna odaklanırken, glüten duyarlılığının yüz görünümü üzerindeki etkisine alan yazında halen açık olan bir araştırma konusudur. Hâlbuki, çölyak, bağırsakta iltihaplanma, bağışıklık sistemi değişiklikleri ve mikro-biyom disbiyozu gibi mekanizmalar yoluyla cildi etkileyen bozulmalarla ilişkilidir. Ayrıca, ÇH, gastrointestinal sistemi etkilemesi ve besinlerin emilim bozukluğuna yol açabilmesi nedeniyle cilt yapısında ve yüz özelliklerinde değişimlere neden olmaktadır. Bu durum gözlemlenebilir yüz özellikleri veya desenleri olan hastalıkların teşhisini ve tanımlanmasını geliştirmek için kullanılan yüz sınıflandırmasının ÇH teşhisine destek vermesinde umut vaat etmektedir. Her ne kadar alan yazında, hastalık öyküsü ve semptomlarına ilişkin verilerin kullanıldığı erken teşhise destek verme amacında çalışmalar bulunsa da yüz görüntülerinin de kullanıldığı hibrit modeller bulunmamaktadır. Buradan hareketle bu tez çalışması iki farklı araştırma sorusu altında planlanmıştır. İlk araştırma sorusu ÇH yüz üzerindeki değişimlere odaklanmış ve“Transfer öğrenme modelleri VGG16 ve MobileNetV2, çölyak hastalığının tanısına yardımcı olmak amacıyla çölyak hastalarının yüz görüntülerini sınıflandırmada ne kadar etkilidir ve hastalığının erken teşhisine anlamlı performansta destek verir mi?”biçiminde kurgulanmıştır. İkinci araştırma sorusunda ise“Birinci basamak sağlık merkezlerinde yapılan rutin kan testi sonuçları ve demografik verilerin kullanılmasıyla çölyak hastalığı Marsh (0-4) düzeyleri makine öğrenme modelleriyle belirlenebilir mi?”odaklanılmış ve yöntem olarak derin öğrenme modelleri (PyTorch) ve geleneksel makine öğrenme algoritmalarının performansları karşılaştırılmıştır. Her iki araştırma sorusuyla alan yazına yeni bir bakış açısı sunulması hedeflenmiştir. Hali hazırda böyle bir veri setinin olmaması nedeniyle Türkiye, Van Eğitim ve Araştırma hastanesinde gastroenteroloji kliniğinde takip edilen ÇH tanılı hastalardan 2022/09-02 etik izni kapsamında veri toplanmıştır. Amaç: Birçok otoimmün hastalıkla benzer semptomları bulunan ÇH'nın erken teşhisinin yapılabilmesi, hastaların en kısa sürede uzmana yönlendirilmesini sağlama amacını güden bir sistem tasarımının yapılabilirliği ve klinikte etkin kullanımının incelenmesinin önemi aşikardır. Buradan hareketle bu tezde ilk olarak yüz görüntülerinin yer aldığı veri tabanının transfer öğrenme yöntemleriyle analizi sonucu çölyak hastalığının erken teşhisine anlamlı performans gösterebilme yeteneğinin sorgulanması amaçlanmaktadır. İkinci olarak ise birinci basamak sağlık birimlerinde diğer hastalıklarla benzer semptomatik özellikleri nedeniyle uzmana yönlendirilmede gecikilmesinin önüne geçilmesinin hedeflendiği rutin kan testi ve demografik verilerle, Karar Ağacı, Rastgele Orman, Gradient Boosting, Naive Bayes ve derin öğrenme(pytorch) sınıflandırma algoritmaları kullanılarak hastalığın teşhisine ve Marsh seviyelerinin belirlenmesine destek verecek bir yöntemin analizinin yapılması da amaçlanmaktadır. Yöntem: Tez çalışmasında iki farklı veri setinden faydalanarak iki amaca uygun yöntem uygulaması yapılarak yorumlanmıştır. İlk araştırma sorusu için, çölyak hastalarının yüz görüntüleri transfer öğrenme yöntemi ile sınıflandırılmıştır. Önceden eğitilmiş iki farklı model (VGG16 ve MobileNetV2) kullanılmış ve en yüksek sınıflandırma performansına sahip model seçilmiştir. İkinci araştırma sorusu için, çölyak hastalarında bağırsak atrofisi (marsh level) belirleme hedefiyle, klinik belirti ve semptomları derin öğrenme ve geleneksel makine öğrenme algoritmaları ile sınıflandırılmış, ve yine en yüksek doğruluk oranına sahip model belirlenmiştir. Her iki aşamada da performans ölçütleri yüksek olan modeller ilerleyen zamanlarda hibrit veri setlerinin kullanılabileceği modellerin geliştirilmesi için seçilmiştir. Yüz görüntülerinin yer aldığı veri setinde (DS_Face), ÇH tanılı ve eşit sayıda kontrol grubuna sahip 200 yetişkine ait yüz görüntüsü bulunmaktadır. DS_Face veri setinde yer alan ÇH tanısı bulunan görüntülerin %70'i kadın, %30'u erkek iken kontrol grubunun dağılımında ise %60 kadın, %40 erkektir. ÇH tanılı yüz görüntülerindeki hastaların 28'ine yeni tanı konmuş, 72'sine önceden tanı almıştır. Önceden tanı konulmuş hastaların 25'i glutensiz diyete uymuyor, 47'si ise kısmen diyete bağlı kalıyordu. Rutin kan testi ve demografik bilgilere dayanarak marsh seviyesinin belirlenmesi amacıyla oluşturulan ikinci veri seti (DS_Marsh); 182 kişiye ait hasta öyküsü, demografik bilgi ve kan testi sonuçlarından oluşmaktadır. DS_Marsh veri seti; 132 kadın ve 50'si erkek hasta dağılımına sahiptir. Bu veri setinde glütensiz diyete uyum dağılımı ise uymayan 72 ve kısmi uyum gösteren 106 kişi biçimindedir. Bulgular: DS_Face veri setinde glüten diyetine uymayan, kısmi uyan, yeni tanılı hastalar ve kontrol grubunun yüz görüntülerinin önceden eğitilmiş VGG16 modelinin kullanılmasıyla yapılan sınıflandırılmasında %73'lük doğruluk oranı elde edilmiştir. Hassasiyet, hatırlama ve F1 puanı değerleri ise sırasıyla 0.54, 0.56 ve 0.52 olarak bulunmuştur. Medipipe model marker'ın kullandığı önceden eğitilmiş MobileNet.v2 Modelinde yaklaşık 0,44'lük bir test kaybına ve test veri kümesinde %85'lik bir doğruluk oranı elde edilmiştir. Hassasiyet, hatırlama ve F1 puanı değerleri sırasıyla 0.80, 0.81 ve 0.80' dir. Sonuç olarak DS_Face veri setinde MobileNet.v2 modeli, VGG16 modeline kıyasla ÇH tanısında daha güçlü bir performans göstermiştir. DS_Marsh veri setinde PyTorch modeli, Marsh seviyelerini belirlemede %80 doğruluk oranında performans göstermiştir. Hassasiyet, geri çağırma ve F1 puanları ise sırasıyla 0.81, 0.80 ve 0.70 olarak ölçülmüştür. Herbiri tam performansla, %100 doğruluk oranı, sınıflandırma kapasitesi gösteren Karar Ağacı, Rastgele Orman ve Gradient Boosting sınıflandırıcılarıyla hassasiyet, geri çağırma ve F1 puanları 1.0, 1.0, 1.0 olarak elde etmiştir. Diğerleriyle kıyaslandığında %55 doğruluk oranı gösteren Naive Bayes sınıflandırıcısının hassasiyet, geri çağırma ve F1 puanları ise sırasıyla 0.67, 0.44 ve 0.53 olarak sıralanmaktadır. Sonuçlar: Birinci araştırma sorusunun incelenmesi için oluşturulan DS_Face veri setinde VGG16 Modeli ve Mobilenet.V2 Modelinin performansları karşılaştırılmıştır. VGG16 Modeli test görüntülerinin yaklaşık dörtte üçünü doğru şekilde sınıflandırmıştır. Mobilenet.V2 Model ise, test görüntülerinin %85 oranında doğru sınıflandırmıştır. VGG16 modelinin, mimari yapısı ve aşağıda belirtilen bazı diğer özellikleri , sınıflandırma performansının MobilenetV2 modelden daha düşük olmasına neden olmuştur. VGG16 model mimarisi gereği daha fazla parametreye sahip daha derin bir ağdır. MobileNetV2 ise daha az parametreyle, küçük veri kümelerinde daha verimli olacak şekilde tasarlanmıştır. Buda, MobilenetV2'nin DS_Face veri setinde daha iyi performans göstermesine neden olmuştur. Ayrıca, MobileNetV2, Mediapipe model marker ile kullanıldığı için, mediapipe model marker, modelin performansını artıran ve daha yüksek doğruluğa katkıda bulunan ek ön işleme ve özellik çıkarımı sağlamıştır. Ve son olarak, daha karmaşık bir model olan VGG16, özellikle veri kümesi yeterince büyük değilse aşırı uyum sağlamış olabilir. Sonuç olarak, Mobilenet.V2 gibi yüz sınıflandırma modellerinin yeni ÇH tanısı almış, önceden ÇH tanısı almış fakat glüten diyetine uymayan hastaların cilt ve yüz özellikleri üzerinde ortaya çıkan değişimler üzerindeki performansları, bu hastalarda erken tanıya destek verebilme yeteneğine sahip karar destek modellerinin geliştirilebilirliğine ilişkin somut bulgular sunmaktadır. İkinci araştırma sorusunun incelenmesi için oluşturulan DS_Marsh veri setinde sınıflandırma için kullanılan modeller, sırasıyla pytorch %80 üzerinde doğruluk gösterirken, Karar Ağacı, Rastgele Orman ve Gradient Boosting ise 100% oranınında performans göstermiştir. Bu rutin kan testi bulguları ve demografik bilgilerin birinci basamak sağlık birimlerinde dahi kullanılabilmesine olanak sağlayacak sistem tasarımlarının hastaların yaşam kalitesi, sağlık sistemindeki hasta yükü ve ekonomiye olan katkıları nedeniyle umut vaat edicidir. İki araştırma sorusuyla hastanın yaşam kalitesinin arttırılması, sağlık hizmetlerinin yükünde ve ekonomide harcamaları azaltmayı amaçlayarak planlanan bu çalışma, karar vermeyi geliştirmek ve hasta sonuçlarına fayda sağlamak için tıbbi teşhislerde veriye dayalı yöntemlerin önemini vurgulamaktadır. İlerleyen çalışmalarda hem yüz görüntülerinin hem rutin kan bulgusu ve demografik bilgilerin kullanılarak erken teşhis için uzmana yönlendirmeyi hızlandıracak hibrit sistem tasarımlarında, Mediapipe model marker'ın önceden eğitilmiş MobileNetV2 modeli ve Karar Ağacı, Rastgele Orman ve Gradient Boosting sınıflandırıcılarının kullanılmasının yüksek performans göstereceği sonucuna varılmıştır.

Özet (Çeviri)

Background: Celiac disease (CD) is one of autoimmune disorder. It is caused by consumption of gluten which is a protein found in barley, rye and wheat. Individuals with CD experience an immunity response due to damage to the lining of their small intestines after consuming gluten, causing them to experience a variety of sign and symptoms also potential long-term complications. Currently definitive diagnosis of CD is typically made by small bowel biopsy, which determines the extent of intestinal damage. Diagnosing celiac disease is difficult because some of its signs and symptoms resemble with other autoimmune diseases. Early diagnosis prevents severe progression of the disease by preventing rapid increase in intestinal permeability. In order to overcome the difficulties experienced in the diagnosis of CD and to enable patients to reach a specialist as soon as possible, it is becoming increasingly important to develop systems that can support diagnosis, with the help of developing technology. While research focuses on intestinal epithelium deformation in the field of video capsule image processing, the effect of gluten sensitivity on facial appearance is still an open research topic in the literature. When looking at the development of celiac disease in the body, it is associated with diseases that impact the skin through intestinal inflammation, immune system problems and microbiome dysbiosis. In addition, CD causes changes in skin structure and facial features because it affects the gastro-intestinal system and can cause malabsorption of nutrients. This holds promise for supporting the diagnosis of CD through face image classification by detecting observable facial features or some patterns. Although there are studies in the literature that aim to support early diagnosis using data on disease history and symptoms, there are no hybrid models that use facial images. Based on this, this thesis study was planned under two different research questions. The first research question focused on the changes on the CD face images and asked,“How effective are the transfer learning models VGG16 and MobileNetV2 in classification CD facial images to aid in the diagnosis, and do they support the early diagnosis of CD with significant performance?”It is structured in the format. The second research question asked:“Can CD Marsh (0-4) levels be determined with machine learning models using routine blood test results and demographic data performed in primary health centers?”focused on and compared the performance of deep learning models (PyTorch) and traditional machine learning algorithms. With both research questions, it is aimed to present a new perspective on the literature. Since such a data set does not currently exist, data was collected from patients diagnosed with CD followed in the gastroenterology clinic at Van Training and Research Hospital, Turkey, within the scope of ethical permission 2022/09-02. Purpose: It is obvious that it is important to examine the feasibility of designing a system that aims to ensure early diagnosis of CD, which has similar symptoms to many autoimmune diseases, and to ensure that patients are referred to a specialist as soon as possible, and to examine its effective use in the clinic. Based on this, this thesis first aims to question the ability of transfer learning with two pretrained models to classify the database containing facial images to show meaningful performance in the early diagnosis of CD. Secondly, it is aimed to prevent delays in referring celiac disease to a specialist in primary health care units due to its similar symptomatic features with other diseases. For this purpose, it is aimed to analyze a method that will support the diagnosis of the disease and the determination of Marsh levels by classifying routine blood test and demographic data with Decision Tree, Random Forest, Gradient Boosting, Naive Bayes and deep learning (Pytorch) algorithms. It is also aimed to analyze a method that will support the determination of the celiac level severity. Method: In the thesis study, two different data sets were used and interpreted by applying two methods suitable for the purpose. For the first research question, facial images of celiac patients were classified using the transfer learning method. Two different pre-trained models (VGG16 and MobileNetV2) were used. Then model with the highest classification performance was selected. For the second research question, with the aim of determining intestinal atrophy (marsh level) in celiac patients, clinical signs and symptoms were classified with deep learning (Pytorch) and traditional machine learning algorithms, and the model with the highest accuracy rate was determined. Models with high performance criteria in both stages were selected for the development of models in which hybrid data sets could be used in the future. In the dataset containing face images (DS_Face), there was a CD diagnosis and an equal number of control groups. There are 200 adult facial images. While 70% of the images diagnosed with CD in the DS_Face dataset is female and 30% are male, the distribution of the control group is 60% female and 40% male. Of the patients in the facial images diagnosed with CD, 28 were newly diagnosed and 72 were previously diagnosed. Of the previously diagnosed patients, 25 did not comply with the gluten-free diet. 47 of them are partially adhered to the diet. The second data set (DS_Marsh) was created to determine the marsh level based on routine blood test and demographic information; It consists of patient history, demographic information and blood test results of 182 people. DS_Marsh dataset; It has a distribution of 132 female and 50 male patients. In this data set, the distribution of compliance with the gluten-free diet is as follows: 72 people who do not comply and 106 people who partially comply. Results: In the DS_Face dataset, an accuracy rate of 73% was reached in the classifying of facial images of non-compliant, partially adherent, newly diagnosed patients and the control group using the pre-trained VGG16 model. Precision, F1 and recall score values were found to be 0.54, 0.52 and 0.56, respectively. Moreover, the pre-trained MobileNet.v2 model used by the Medipipe model marker had a test loss of approximately 0.44 and an accuracy rate of 85% on the test dataset with 0.80 precision, 0.81 recall and 0.80 F1 scores. As a result, in the DS_Face dataset, the MobileNet.v2 model showed a stronger performance in CD diagnosis compared to the VGG16 model. On the DS_Marsh dataset, the PyTorch model performed with 80% accuracy in determining Marsh levels. Recall, precision, and F1 scores were measured as 0.80, 0.81 and 0.70, respectively. Recall, precision, and F1 cores were achieved as 1.0, 1.0, 1.0 with the Decision Tree, Random Forest and Gradient Boosting classifiers, each of which showed full performance, 100% accuracy rate and classification capacity. The recall, precision, and F1 scores of the Naive Bayes classifier, which shows a 55% accuracy rate compared to others, are listed as 0.44, 0.67 and 0.53, respectively. Conclusion: The performances of the VGG16 Model and Mobilenet.V2 Model were compared in the DS_Face data set created to examine the first research question. Model VGG16 correctly classified almost one third of the test images. Mobilenet.V2 Model classified 85% of the test images correctly. The VGG16 model's classification performance was lower than the MobilenetV2 model due to its architectural structure and some other features mentioned below. VGG16 is a deeper network with more parameters due to its model architecture and more suitable for big dataset. MobileNetV2, on the other hand, is designed to be more efficient on small data sets with fewer parameters. This caused MobilenetV2 to perform better on the DS_Face dataset. Additionally, since MobileNetV2 was used with the Mediapipe model marker, the mediapipe model marker provided additional preprocessing and feature extraction that improved the performance of the model and contributed to higher accuracy. And finally, VGG16, a more complex model, may have overfitted, especially if the dataset is not large enough. In conclusion, the performance of facial classification models such as Mobilenet.V2 on the changes that occur on the skin and facial features of patients newly diagnosed with CD and previously diagnosed but not complying with the gluten diet provides concrete findings regarding the development of decision support models capable of supporting early diagnosis in these patients. The models used for classification in the DS_Marsh dataset created to examine the second research question, respectively, showed over 80% accuracy in Pytorch, while Decision Tree, Random Forest and Gradient Boosting showed 100% performance. System designs that will allow these routine blood test findings and demographic information to be used even in primary health care units are promising due to their contribution to the quality of life of patients, the patient load in the healthcare system, and the economy. This study, planned with two research questions to improve the patient' life quality and reduce the burden of healthcare services and expenses in the economy, emphasizes the importance of data-based methods in medical diagnoses to improve decision-making and benefit patient outcomes. In future studies, it has been concluded that the use of the Mediapipe model marker with pre-trained MobileNetV2 model and Decision Tree, Random Forest and Gradient Boosting classifiers will provide high performance in hybrid system designs that will accelerate referral to a specialist for early diagnosis by using both facial images, routine blood findings and demographic information.

Benzer Tezler

  1. A symptom based clinical decision support system for early diagnosis of Behcets disease

    Behçet hastalığının erken teşhisi için semptom temelli bir karar destek aracı

    LEILI NOZAD DIZAJI

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    Biyoistatistikİstanbul Üniversitesi

    Genetik Ana Bilim Dalı

    DOÇ. DR. FEYZANUR TUNCER KILINÇ

    PROF. DR. BEKİR SIDDIK BİNBOĞA YARMAN

  2. Sağlık alanında istifleme temelli yapay zeka yöntemleri ve uygulamaları

    Stacking-based artificial intelligence methods and applications in health care

    SULTAN TURHAN YALÇIN

    Doktora

    Türkçe

    Türkçe

    2024

    BiyoistatistikMuğla Sıtkı Koçman Üniversitesi

    İstatistik Ana Bilim Dalı

    DOÇ. DR. ERALP DOĞU

  3. Matematik okuryazarlık yeterliklerinin gelişimine dayalı bir modüler programın tasarlanması, uygulanması ve değerlendirilmesi

    Design, implementation and evaluation of a modular program based on the development of mathematical literacy competencies

    TUĞÇE KOZAKLI ÜLGER

    Doktora

    Türkçe

    Türkçe

    2021

    Eğitim ve ÖğretimBursa Uludağ Üniversitesi

    Matematik ve Fen Bilimleri Eğitimi Ana Bilim Dalı

    PROF. DR. MURAT ALTUN

  4. Özel bir piston ve kilit mekanizmasına sahip yüksek başlangıç ivmeli göğüs kompresyon cihazının tasarımı, simülasyonu ve üretimi

    Design, simulation, and fabrication of a high initial acceleration automatic chest compression device with a special piston and locking mechanism

    AHMET KAĞIZMAN

    Doktora

    Türkçe

    Türkçe

    2024

    Biyomühendislikİstanbul Teknik Üniversitesi

    Mekatronik Mühendisliği Ana Bilim Dalı

    PROF. DR. VOLKAN SEZER

  5. Öğrencilerin istatistiksel okuryazarlıklarının kendi ürettikleri örnekler bağlamında incelenmesi

    Examination of students statistical literacy within the context of learner generated examples

    BEHİCE NUR KALKAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Eğitim ve ÖğretimHacettepe Üniversitesi

    Matematik ve Fen Bilimleri Eğitimi Ana Bilim Dalı

    DOÇ. DR. YASEMİN SAĞLAM KAYA