16s rRNA gen dizileme verilerini kullanarak pediatrik crohn hastalığının tanısında makine öğrenmesi modellerinin uygulanması
Implementation of machine learning models for the diagnosis of pediatric crohn's disease using 16s rRNA gene sequencing data
- Tez No: 930160
- Danışmanlar: PROF. DR. KEMAL TURHAN
- Tez Türü: Doktora
- Konular: Biyoistatistik, Biostatistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2025
- Dil: Türkçe
- Üniversite: Karadeniz Teknik Üniversitesi
- Enstitü: Sağlık Bilimleri Enstitüsü
- Ana Bilim Dalı: Biyoistatistik ve Tıp Bilişimi Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 107
Özet
Kronik bir gastrointestinal inflamatuar hastalık olan Crohn hastalığı, sıklığı ve prevalansı gün geçtikçe artmakta olan inflamasyon, fibrotik darlıklar, enterik fistül ve bağırsak neoplazisi gibi sorunlara sebep olabilen bir hastalıktır. Crohn hastalığı tanısı günlük pratikte hastanın tüm şikayetleri, muayene bulguları, laboratuvar sonuçları, kolonoskopi ve görüntüleme bulguları ve patolojik veriler dikkate alınarak teşhisi konulmaktadır. Literatürde yapılan çalışmalar incelendiğinde pediatrik grupta yer alan Crohn hastalarında büyüme ve gelişim bozukluğu sık görülmektedir. Hastalığın erken teşhisi gittikçe önem kazanmaktadır. Tez çalışmasında NCBI PRJEB13679 numaralı projeden alınan 765 hastaya ait Illumina MiSeq verisi kullanılmıştır. Pediatrik Crohn hastaları ve kontrol grubu arasında sınıflama yapabilmek için ileum ve rektum verisi kullanılmıştır. Çalışmada kullanılmış olan 16S rRNA geni bakteri ve arkelerde yüksek oranda korunmuştur. Bununla birlikte türe özgü farklılıkların belirlenebileceği (V1-V9) dokuz hiper değişken bölge vardır. Bu sebeple 16s rRNA taksonomik parmak izi olarak değerlendirilmektedir. Tez çalışmasında Crohn hastalığı teşhisi için 16S rRNA gen dizilemesine ait sekans verisi dikkate alınarak 8 farklı temsil vektörü ve 4 farklı sınıflama modeli kullanılmıştır. Çalışmada 4-mer, 5-mer, 6-mer temsil vektörlerinin yanında QIIME2 aracı kullanılarak oluşturulan tür seviyesinde taksonomik ataması yapılan ASV tabloları ve cins seviye ataması yapılan ASV tabloları ve bu tabloların birleştirilmesi ile oluşturulan temsil vektörlerin yanında DNABERT-S ön eğitimli modeli kullanılarak oluşturulan temsil vektörleri kullanılmıştır. En iyi sonuçlar uyarlanabilir güçlendirme algoritmasının birleştirilmiş (cins seviye ASV tablosu + tür seviye ASV tablosu) temsil vektörleri ile kullanılmasıyla elde edilmiştir (Doğruluk 0.86, Ağırlıklandırılmış-Duyarlılık 0.86, Ağırlıklandırılmış-Kesinlik 0.85 ve Ağırlıklandırılmış-AUC skor 0.90, Ağırlıklandırılmış-F1 skor 0.85). Geliştirilen modelin Crohn hastalığının erken teşhisine yardımcı olarak tedavi süreçlerinin başlatılmasında oldukça önemli olması beklenmektedir.
Özet (Çeviri)
Crohn's disease, a chronic gastrointestinal inflammatory disease, is a disease that can cause problems such as inflammation, fibrotic strictures, enteric fistula and intestinal neoplasia, the frequency and prevalence of which are continue to icrease. Crohn's disease is diagnosed by considering all the patient's complaints, examination findings, laboratory results, colonoscopy and imaging findings, and pathological data. When the studies in the literature are examined, growth and developmental disorders are frequently seen in Crohn's patients in the pediatric group. Early diagnosis of the disease is becoming increasingly important. Illumina MiSeq data from 765 patients obtained from the NCBI project number PRJEB13679 were used in the thesis study. Ileum and rectum data were used to classify pediatric Crohn's patients and the control group. The 16S rRNA gene used in the study is highly conserved in bacteria and archaea. However, there are nine hypervariable regions (V1-V9) where species-specific differences can be determined. For this reason, 16s rRNA is considered as a taxonomic fingerprint. In the thesis study, 8 different representation vectors and 4 different classification models were used to evaluate the sequence data of 16S rRNA gene sequencing for the diagnosis of Crohn's disease. In the study, in addition to 4-mer, 5-mer, 6-mer representation vectors, ASV tables with taxonomic assignment at the species level created using the QIIME2 tool, ASV tables with genus assignment, and representation vectors created by merging these tables, as well as representation vectors created using DNABERT-S pretrained model were used. The best results were obtained by using the Adaptive Boosting algorithm with combined (genus level ASV table + species level ASV table) representation vectors (Accuracy 0.86, Weighted-Sensitivity 0.86, Weighted-Precision 0.85 and Weighted-AUC score 0.90, Weighted-F1 score 0.85). The developed model is expected to be very important in initiating treatment processes by helping in the early diagnosis of Crohn's disease.
Benzer Tezler
- Gönen ve Afyonkarahisar termal sularında metagenomik çalışmalar
Metagenomic studies in Gönen and Afyonkarahisar thermal waters
SULTAN FİDAN PEDÜK
Doktora
Türkçe
2025
Biyolojiİstanbul ÜniversitesiMoleküler Biyoloji ve Genetik Ana Bilim Dalı
PROF. DR. ERCAN ARICAN
- Kapadokya yöresi topraklarından aktinomiset izolasyonu ve polifazik taksonomisi
Isolation of actinomycetes from Cappadocia regions soil and polyphasic taxonomy
TALHA GENÇBAY
- Discovery of novel enzymes using proteomic approaches
Proteomik yaklaşımlar kullanılarak yeni enzimlerin keşfi
MERVE ÖZTUĞ KILINÇ
Doktora
İngilizce
2021
Biyokimyaİstanbul Teknik ÜniversitesiMoleküler Biyoloji-Genetik ve Biyoteknoloji Ana Bilim Dalı
PROF. DR. NEVİN GÜL KARAGÜLER
DOÇ. DR. MÜSLÜM AKGÖZ
- Recombinant production and characterization of chitinase enzyme from Pseudomonas mandelii KGI_MA19
Pseudomanas mandelii KGI_MA19 organızmasına ait kitinaz enziminin rekombinant üretimi ve karakterizasyonu
EMİNE TUĞÇE SARAÇ CEBECİ
Yüksek Lisans
İngilizce
2022
Biyoteknolojiİstanbul Teknik ÜniversitesiMoleküler Biyoloji-Genetik ve Biyoteknoloji Ana Bilim Dalı
PROF. DR. NEVİN GÜL KARAGÜLER
- Third-generation sequencing technology to define microbial diversity in wheat cultivated soils in Turkey
Başlık çevirisi yok
JANA AL KHODOR
Yüksek Lisans
İngilizce
2022
GenetikSabancı ÜniversitesiMoleküler Biyoloji-Genetik ve Biyomühendislik Ana Bilim Dalı
DR. ÖĞR. ÜYESİ STUART JAMES LUCAS