Geri Dön

İnsan mikrobiyomu ve hastalık ilişkisinin tahmininde makine öğrenmesi uygulamaları

Machine learning approaches to predict the human microbiome and disease associations

  1. Tez No: 850914
  2. Yazar: METEHAN ÜNAL
  3. Danışmanlar: DOÇ. DR. GAZİ ERKAN BOSTANCI, DOÇ. DR. CEREN ÖZKUL KOÇAK
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: Türkçe
  9. Üniversite: Ankara Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 120

Özet

İnsan mikrobiyomu, insan sağlığına tesir eden, hastalıkların oluşmasında veya önlenmesinde etkisinin olduğu bilinen, mikrobiyota adı verilen trilyonlarca mikroorganizma ve onların genetik materyallerini barındırır. Buradan alınan genetik dizilim örnekleriyle oluşturulan veri setleri üzerinde yapılacak olan Makine Öğrenmesi analizleri, pek çok hastalığın erken teşhisine olanak sağlayacaktır. Bu amaç doğrultusunda bu çalışmada, insan bağırsak mikrobiyotasından alınmış ham dizilim örneklerini ile İnflamatuar Bağırsak Hastalığı ve onun alttürü Crohn Hastalığını tahmin etmek için, k-Nearest Neighbor, Light Gradient Boosting Machine, Logistic Regression, Random Forest, Support Vector Machine ve XGBoost gibi modern Makine Öğrenmesi tekniklerini kullanıldı. Halka açık veri bankalarından elde edilen veri seti ön işleme yapılarak ham dizilim verilerine dönüştürüldü. Bu genetik dizilimler bu tez çalışmasında geliştirilen yöntem ile önce k-mer tabanlı De Bruijn graflara daha sonra yapılandırılmış bir forma dönüştürüldü. Bu veri seti kullanılarak 3 analiz yapıldı. İlk analizde, sadece Crohn Hastalığına sahip bireyler hasta kabul edildi ve veri seti dengelenmemiş halde bırakıldı. İkinci analizde ise SMOTE algoritması ile ilk analizdeki veri seti dengeli hale getirildi. Son analizde ise İnflamatuar Bağırsak Hastalığı'nın tüm türlerine sahip örnekler hasta olarak kabul edildi ve veri seti buna göre dengelendi. Makine Öğrenmesi modellerinin performansları doğruluk, hassasiyet, geri çağırma, F1 Skor ve AUC skoru olmak üzere toplam beş ayrı metrikle ölçüldü. Doğruluk skorları dikkate alındığında ilk analizde k-mer uzunluğu 5 için LGBM (%76,47), ikinci analizde k-mer uzunluğu 6 için RF (%79,52) ve son analizde k-mer uzunluğu 5 için SVM (%95,11) en yüksek performansı gösteren modeller oldu. En son kısımda gerçekleştirilen McNemar testi, yapılan analizlerin istatistiksel olarak anlamlı olduklarını gösterdi.

Özet (Çeviri)

The human microbiome contains trillions of microorganisms and their genetic materials, called microbiota, that affect human health and are known to have an effect on the formation or prevention of diseases. Machine Learning analyzes to be performed on the data sets created with the genetic sequence samples taken here will enable the early diagnosis of many diseases. For this purpose, in this study, modern machine learning techniques including k-Nearest Neighbor, Light Gradient Boosting Machine, Logistic Regression, Random Forest, Support Vector Machine and XGBoost were used to predict Inflammatory Bowel Disease and its subtype Crohn's Disease with raw sequence samples taken from human gut microbiota. The dataset obtained from public databases preprocessed and converted into raw sequence data. These genetic sequences were first converted into k-mer based De Bruijn graphs and then into a structured form with the method developed in this thesis. Three analyzes were performed using this data set. In the first analysis, only individuals with Crohn's Disease were considered patients and the data set was left unbalanced. In the second analysis, the data set in the first analysis was balanced with the SMOTE algorithm. In the final analysis, samples with all types of Inflammatory Bowel Disease were considered patients and the data set was balanced accordingly. The performances of Machine Learning models were measured and compared with 5 separate metrics. Considering the accuracy scores, the highest performing models were LGBM (76.47%) for k-mer length 5 in the first analysis, RF (79.52%) for k-mer length 6 in the second analysis, and SVM (95.11%) for k-mer length 5 in the final analysis. The McNemar test performed in the last part showed that the analyzes were statistically significant.

Benzer Tezler

  1. Menopoz öncesi ve sonrası kadınlarda salya ve dental plak mikrobiyomunun periodontal parametreler ile ilişkisinin incelenmesi

    Evaluation of dental plaque and saliva microbiome and their association with periodontal parameters in premenopausal and postmenopausal women

    NİL YAKAR YILMAZ

    Doktora

    Türkçe

    Türkçe

    2024

    MikrobiyolojiEge Üniversitesi

    Biyoloji Ana Bilim Dalı

    PROF. DR. GÜVEN ÖZDEMİR

    PROF. DR. GÜLNUR EMİNGİL

  2. Sağlıklı anneden C/S ile doğan term ve preterm bebeklerde kanda p-cresol ve indoxyl sülfat düzeylerinin karşılaştırılması ve mikrobiyota ile ilişkisinin değerlendirilmesi

    Comparison of blood p-cresol and indoxyl sulfate levels in term and preterm babies born with C/S from healthy mother and evaluation of their relationship with microbiota

    PELİN ABDAL YILDIRIM

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2022

    Çocuk Sağlığı ve HastalıklarıEge Üniversitesi

    Çocuk Sağlığı ve Hastalıkları Ana Bilim Dalı

    DOÇ. DR. DEMET TEREK

  3. Metaproteomic analysis of saliva samples from parkinson's disease patients with cognitive impairments

    Kognitif bozukluğu olan parkinson hastalarından alınan tükürük örneklerinin metaproteomik analizi

    BALKIS KURBEH

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Biyoteknolojiİstanbul Medipol Üniversitesi

    Moleküler Tıp ve Biyoteknoloji Ana Bilim Dalı

    PROF. DR. SÜLEYMAN YILDIRIM

  4. Gebelik planlayan kadınlarda mikrobiyota farkındalık düzeylerinin belirlenmesi

    Determination of microbiota awareness levels in women planning pregnancy

    RABİA ATAY

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    EbelikKırklareli Üniversitesi

    Ebelik Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ÖZGENUR YILMAZ

  5. Ülseratif kolit hastalığında fusobacterium nucleatum miktarının tümör nekroz faktör (TNF) alfa tedavisi üzerindeki etkilerinin araştırılması

    Investigating the effects of fusobacterium nucleatum levels on tumor necrosis factor (TNF) alpha therapy in ulcerative colitis disease

    BİLGE ŞENYÜZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Tıbbi BiyolojiEge Üniversitesi

    Tıbbi Biyoloji Ana Bilim Dalı

    DOÇ. DR. SUNDE YILMAZ SÜSLÜER