İnsan mikrobiyota verisi üzerinde makine öğrenmesi ve derin öğrenme yöntemlerini kullanarak otizm spektrum bozukluğu tespiti
Detection of autism spectrum disorder using machine learning and deep learning methods on human microbiota data
- Tez No: 920683
- Danışmanlar: DOÇ. DR. HABİL KALKAN, DR. ÖĞR. ÜYESİ FÜSUN ER
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2025
- Dil: Türkçe
- Üniversite: Gebze Teknik Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 93
Özet
Otizm Spektrum Bozukluğu (OSB), sosyal etkileşim, iletişim becerileri ve davranışlarda zorluklarla karakterize karmaşık bir nörogelişimsel durumdur. Günümüzde OSB için kesin bir tanı ve tedavi yöntemi bulunmamaktadır. Son yıllarda, bağırsak mikrobiyotası ile beyin arasındaki ilişkiye odaklanan araştırmalar, OSB'nin etiyolojisinde ve semptomlarında bağırsak mikrobiyotasının potansiyel rolünü öne çıkarmıştır. Bu çalışma, OSB ile bağırsak mikrobiyotası arasındaki ilişkileri derin öğrenme yöntemleri ve veri füzyon teknikleri kullanarak araştırmayı amaçlamaktadır. Amerikan Bağırsak Projesi'nden (AGP) elde edilen veriler kullanılarak, mikrobiyota kompozisyonu ve çevresel faktörler ile OSB arasındaki potansiyel bağlantılar incelenmiştir. Çalışmada, RFECV (Recursive Feature Elimination with Cross-Validation), Fisher Skoru ve Dikkat Mekanizması (Attention Mechanism) gibi öznitelik seçim yöntemleri kullanılarak en etkili mikrobiyota ve çevresel öznitelikler belirlenmiştir. Ardından, çeşitli makine öğrenmesi ve derin öğrenme modelleri (Rastgele Orman, XGBoost, CatBoost, Derin Sinir Ağları vb.) uygulanmış ve performansları karşılaştırılmıştır. Ayrıca, erken ve geç füzyon teknikleri kullanılarak mikrobiyota ve çevresel verilerin birleştirilmesinin model performansına etkisi değerlendirilmiştir. Sonuçlar, CatBoost modelinin hem mikrobiyota hem de çevresel veriler için en iyi performansı gösterdiğini ortaya koymuştur. Makine öğrenmesi modellerinin açıklanabilirliği tarafında SHapley Additive exPlanations (SHAP) analizi, OSB ile en güçlü ilişkiyi gösteren mikrobiyal türleri ve çevresel faktörleri belirlememizi sağlamıştır. Veri füzyon tekniklerinin uygulanması, tek veri kaynağı kullanımına kıyasla model performansında artış sağlamıştır. Çalışmanın literatüre özgün katkısı, mikrobiyota verileri ile demografik ve çevresel verilerin füzyon teknikleriyle birleştirilerek kapsamlı bir analiz yaklaşımı sunmasıdır. Farklı makine öğrenmesi ve derin öğrenme modellerinin detaylı karşılaştırmalı analizi, SHAP analizleri ile model kararlarının açıklanabilirliğinin sağlanması ve mikrobiyota versisine ek olarak çevresel özniteliklerin kullanılması, OSB'nin biyolojik temellerinin daha iyi anlaşılmasına katkıda bulunmuştur. Elde edilen bulgular, OSB'nin erken tanısı için potansiyel biyobelirteçlerin belirlenmesine yönelik yeni bir perspektif sunmakta ve OSB araştırmalarında çok boyutlu veri analizi yaklaşımlarının önemini vurgulamaktadır. Kullanılan yenilikçi yöntemler ve elde edilen sonuçlar, gelecekteki OSB araştırmalarında bağırsak mikrobiyotası ve çevresel faktörlerin birlikte değerlendirilmesi için metodolojik bir çerçeve oluşturmaktadır.
Özet (Çeviri)
Autism Spectrum Disorder (ASD) is a complex neurodevelopmental condition characterized by difficulties in social interaction, communication skills, and behavior. Currently, there is no definitive diagnosis or treatment method for ASD. In recent years, research focusing on the relationship between gut microbiota and the brain has highlighted the potential role of gut microbiota in the etiology and symptoms of ASD. This study aims to investigate the relationships between ASD and gut microbiota using deep learning methods and data fusion techniques. Using data obtained from the American Gut Project (AGP), potential connections between microbiota composition, environmental factors, and ASD were examined. In the study, the most effective microbiota and environmental features were determined using feature selection methods such as RFECV (Recursive Feature Elimination with Cross-Validation), Fisher Score, and Attention Mechanism. Subsequently, various machine learning and deep learning models (Random Forest, XGBoost, CatBoost, Deep Neural Networks, etc.) were applied and their performances were compared. Additionally, the effect of combining microbiota and environmental data on model performance was evaluated using early and late fusion techniques. Results revealed that the CatBoost model showed the best performance for both microbiota and environmental data. SHapley Additive exPlanations (SHAP) analysis allowed us to identify the microbial species and environmental factors that showed the strongest association with ASD. The application of data fusion techniques resulted in improved model performance compared to using a single data source. The unique contribution of this study to the literature is its comprehensive analytical approach that combines microbiota data with demographic and environmental data using fusion techniques. Detailed comparative analysis of different machine learning and deep learning models, ensuring model decision explainability through SHAP analyses, and the use of environmental features in addition to microbiota data have contributed to a better understanding of the biological foundations of ASD. The findings present a new perspective for identifying potential biomarkers for early diagnosis of ASD and emphasize the importance of multidimensional data analysis approaches in ASD research. The innovative methods used and the results obtained provide a methodological framework for future ASD research in jointly evaluating gut microbiota and environmental factors.
Benzer Tezler
- Bağırsak metagenomunda bulunan tek nükleotid polimorfizmlerinin metagenom madenciliği kullanılarak karaciğer sirozu hastalığı ile ilişkilendirilmesi
Association of single nucleotide polymorphisms in gut metagenome with liver cirrhosis disease using metagenome mining
KÜBRA YALÇIN
Yüksek Lisans
Türkçe
2020
BiyoistatistikErciyes ÜniversitesiBiyoenformatik Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ÖZKAN UFUK NALBANTOĞLU
- Discovery of small molecules with inhibitory potential and therapeutic peptide design against clostridium difficile infection
Clostridium difficile enfeksiyonuna yönelik inhibitör potansiyeline sahip küçük molekül keşfi ve terapötik peptid tasarımı
DAMLA NUR ÇAMLI
Yüksek Lisans
İngilizce
2025
Biyolojiİstanbul Medeniyet ÜniversitesiBiyomühendislik Ana Bilim Dalı
DR. ÖĞR. ÜYESİ SALİHA ECE ACUNER ZORLUUYSAL
- Berberin ve bağırsak mikrobiyota ilişkisinin hastalıklar üzerine etkisi: Bir derleme çalışması
The effect of berberine and intestinal microbiota relationship on diseases: A review study
DAMLA BEYAZGÜL
Yüksek Lisans
Türkçe
2024
Beslenme ve DiyetetikHaliç ÜniversitesiBeslenme ve Diyetetik Ana Bilim Dalı
DOÇ. DR. NURAY ESRA AKSAKAL
- Sağlıklı ailelerde bağırsak mikrobiyota parmak izinin kültüromik maldı-TOF MS yaklaşımı ile belirlenmesi
Determination of gut microbiota fingerprints of healthy families using by culturomics maldi-TOF MS approach
SELEN GÜÇLÜ DURGUN
Doktora
Türkçe
2019
Tıbbi BiyolojiGazi ÜniversitesiTıbbi Biyoloji ve Genetik Ana Bilim Dalı
PROF. DR. ABDULLAH EKMEKÇİ
- A multidisciplinary approach to sustainable agriculture: the impact of microbial and organomineral fertilization on soil bacteria, crop yield, and farmer adoption
Sürdürülebilir tarıma multidisipliner bir yaklaşım: mikrobiyal ve organomineral gübrelemenin toprak bakterileri, verim ve çiftçi benimsemesi üzerindeki etkisi
CEYDA ALAT DORUK
Yüksek Lisans
İngilizce
2025
Genetikİstanbul Teknik ÜniversitesiEkoloji ve Evrim Ana Bilim Dalı
PROF. DR. BÜLENT ARIKAN