Geri Dön

16s rRNA gen dizileme verilerini kullanarak pediatrik crohn hastalığının tanısında makine öğrenmesi modellerinin uygulanması

Implementation of machine learning models for the diagnosis of pediatric crohn's disease using 16s rRNA gene sequencing data

  1. Tez No: 930160
  2. Yazar: SİNEM ÖZDEMİR
  3. Danışmanlar: PROF. DR. KEMAL TURHAN
  4. Tez Türü: Doktora
  5. Konular: Biyoistatistik, Biostatistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2025
  8. Dil: Türkçe
  9. Üniversite: Karadeniz Teknik Üniversitesi
  10. Enstitü: Sağlık Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Biyoistatistik ve Tıp Bilişimi Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 107

Özet

Kronik bir gastrointestinal inflamatuar hastalık olan Crohn hastalığı, sıklığı ve prevalansı gün geçtikçe artmakta olan inflamasyon, fibrotik darlıklar, enterik fistül ve bağırsak neoplazisi gibi sorunlara sebep olabilen bir hastalıktır. Crohn hastalığı tanısı günlük pratikte hastanın tüm şikayetleri, muayene bulguları, laboratuvar sonuçları, kolonoskopi ve görüntüleme bulguları ve patolojik veriler dikkate alınarak teşhisi konulmaktadır. Literatürde yapılan çalışmalar incelendiğinde pediatrik grupta yer alan Crohn hastalarında büyüme ve gelişim bozukluğu sık görülmektedir. Hastalığın erken teşhisi gittikçe önem kazanmaktadır. Tez çalışmasında NCBI PRJEB13679 numaralı projeden alınan 765 hastaya ait Illumina MiSeq verisi kullanılmıştır. Pediatrik Crohn hastaları ve kontrol grubu arasında sınıflama yapabilmek için ileum ve rektum verisi kullanılmıştır. Çalışmada kullanılmış olan 16S rRNA geni bakteri ve arkelerde yüksek oranda korunmuştur. Bununla birlikte türe özgü farklılıkların belirlenebileceği (V1-V9) dokuz hiper değişken bölge vardır. Bu sebeple 16s rRNA taksonomik parmak izi olarak değerlendirilmektedir. Tez çalışmasında Crohn hastalığı teşhisi için 16S rRNA gen dizilemesine ait sekans verisi dikkate alınarak 8 farklı temsil vektörü ve 4 farklı sınıflama modeli kullanılmıştır. Çalışmada 4-mer, 5-mer, 6-mer temsil vektörlerinin yanında QIIME2 aracı kullanılarak oluşturulan tür seviyesinde taksonomik ataması yapılan ASV tabloları ve cins seviye ataması yapılan ASV tabloları ve bu tabloların birleştirilmesi ile oluşturulan temsil vektörlerin yanında DNABERT-S ön eğitimli modeli kullanılarak oluşturulan temsil vektörleri kullanılmıştır. En iyi sonuçlar uyarlanabilir güçlendirme algoritmasının birleştirilmiş (cins seviye ASV tablosu + tür seviye ASV tablosu) temsil vektörleri ile kullanılmasıyla elde edilmiştir (Doğruluk 0.86, Ağırlıklandırılmış-Duyarlılık 0.86, Ağırlıklandırılmış-Kesinlik 0.85 ve Ağırlıklandırılmış-AUC skor 0.90, Ağırlıklandırılmış-F1 skor 0.85). Geliştirilen modelin Crohn hastalığının erken teşhisine yardımcı olarak tedavi süreçlerinin başlatılmasında oldukça önemli olması beklenmektedir.

Özet (Çeviri)

Crohn's disease, a chronic gastrointestinal inflammatory disease, is a disease that can cause problems such as inflammation, fibrotic strictures, enteric fistula and intestinal neoplasia, the frequency and prevalence of which are continue to icrease. Crohn's disease is diagnosed by considering all the patient's complaints, examination findings, laboratory results, colonoscopy and imaging findings, and pathological data. When the studies in the literature are examined, growth and developmental disorders are frequently seen in Crohn's patients in the pediatric group. Early diagnosis of the disease is becoming increasingly important. Illumina MiSeq data from 765 patients obtained from the NCBI project number PRJEB13679 were used in the thesis study. Ileum and rectum data were used to classify pediatric Crohn's patients and the control group. The 16S rRNA gene used in the study is highly conserved in bacteria and archaea. However, there are nine hypervariable regions (V1-V9) where species-specific differences can be determined. For this reason, 16s rRNA is considered as a taxonomic fingerprint. In the thesis study, 8 different representation vectors and 4 different classification models were used to evaluate the sequence data of 16S rRNA gene sequencing for the diagnosis of Crohn's disease. In the study, in addition to 4-mer, 5-mer, 6-mer representation vectors, ASV tables with taxonomic assignment at the species level created using the QIIME2 tool, ASV tables with genus assignment, and representation vectors created by merging these tables, as well as representation vectors created using DNABERT-S pretrained model were used. The best results were obtained by using the Adaptive Boosting algorithm with combined (genus level ASV table + species level ASV table) representation vectors (Accuracy 0.86, Weighted-Sensitivity 0.86, Weighted-Precision 0.85 and Weighted-AUC score 0.90, Weighted-F1 score 0.85). The developed model is expected to be very important in initiating treatment processes by helping in the early diagnosis of Crohn's disease.

Benzer Tezler

  1. Gönen ve Afyonkarahisar termal sularında metagenomik çalışmalar

    Metagenomic studies in Gönen and Afyonkarahisar thermal waters

    SULTAN FİDAN PEDÜK

    Doktora

    Türkçe

    Türkçe

    2025

    Biyolojiİstanbul Üniversitesi

    Moleküler Biyoloji ve Genetik Ana Bilim Dalı

    PROF. DR. ERCAN ARICAN

  2. Kapadokya yöresi topraklarından aktinomiset izolasyonu ve polifazik taksonomisi

    Isolation of actinomycetes from Cappadocia regions soil and polyphasic taxonomy

    TALHA GENÇBAY

    Doktora

    Türkçe

    Türkçe

    2019

    BiyolojiOndokuz Mayıs Üniversitesi

    Biyoloji Ana Bilim Dalı

    PROF. DR. KAMİL IŞIK

  3. Discovery of novel enzymes using proteomic approaches

    Proteomik yaklaşımlar kullanılarak yeni enzimlerin keşfi

    MERVE ÖZTUĞ KILINÇ

    Doktora

    İngilizce

    İngilizce

    2021

    Biyokimyaİstanbul Teknik Üniversitesi

    Moleküler Biyoloji-Genetik ve Biyoteknoloji Ana Bilim Dalı

    PROF. DR. NEVİN GÜL KARAGÜLER

    DOÇ. DR. MÜSLÜM AKGÖZ

  4. Recombinant production and characterization of chitinase enzyme from Pseudomonas mandelii KGI_MA19

    Pseudomanas mandelii KGI_MA19 organızmasına ait kitinaz enziminin rekombinant üretimi ve karakterizasyonu

    EMİNE TUĞÇE SARAÇ CEBECİ

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Biyoteknolojiİstanbul Teknik Üniversitesi

    Moleküler Biyoloji-Genetik ve Biyoteknoloji Ana Bilim Dalı

    PROF. DR. NEVİN GÜL KARAGÜLER

  5. Third-generation sequencing technology to define microbial diversity in wheat cultivated soils in Turkey

    Başlık çevirisi yok

    JANA AL KHODOR

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    GenetikSabancı Üniversitesi

    Moleküler Biyoloji-Genetik ve Biyomühendislik Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ STUART JAMES LUCAS