Comparison of Entropy and Ensemble-based feature selection through network analysis of Alzheimers disease-associated variants
Alzheimer ile ilişkili varyantların ağ analizi üzerinden Entropy ve Ensemble bazlı değişken seçiminin karşılaştırılması
- Tez No: 720438
- Danışmanlar: DOÇ. DR. YEŞİM AYDIN SON
- Tez Türü: Yüksek Lisans
- Konular: Biyoistatistik, Biyoloji, Genetik, Biostatistics, Biology, Genetics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Enformatik Enstitüsü
- Ana Bilim Dalı: Sağlık Bilişimi Ana Bilim Dalı
- Bilim Dalı: Biyoenformatik Bilim Dalı
- Sayfa Sayısı: 136
Özet
Alzheimer Hastalığı (AD) , hafıza ve düşünme becerilerini yavaş yavaş yok eden ve sonunda günlük işleri yapma yeteneğini kaybetmeye neden olan karmaşık, ilerleyici ve geri dönüşü olmayan bir beyin hastalığıdır. Grubumuz şu anda, Geç Başlangıçlı Alzheimer Hastalığı (LOAD) vakalarının ayırıcı tanısı için genotipleme ve fenotipleme verilerinin entegre edildiği in-siliko AD modelleri geliştirmektedir. ADNI ve dbGAP tarafından sağlanan ve 5000'den fazla LOAD hastasının genotipleme verilerini içeren dört farklı LOAD veri setinin meta analizi devam etmektedir. Bu çalışmada, entropi ve ensembl modelleme olmak üzere iki farklı yaklaşımla seçilen varyantların biyolojik olarak yorumlanmasını sağladık. İlk olarak, LOAD ile ilişkili varyantlar, genomik konumları, sonuçları, gen ve protein ürünleri ve biyolojik yolakları ile ilişkilendirilmiştir. Öncelik verilen protein kodlama varyantları, ağ, PPI ve zenginleştirme analizinden sonra LOAD ile ilgili biyolojik yollar ile ilişkilerine dayalı olarak deneysel doğrulama için seçilmiştir. 32 varyant için pirosekanslama primerleri tasarlanarak ve pirosekanslama primerleri optimize edilmiştir. 43 LOAD ve 38 sağlıklı katılımcıdan oluşan vaka-kontrol grubunda öncelikli varyantlar için genotiplendirilmiştir. Makine öğrenimi modellerinin, birden çok değişkenin riski belirlediği doğrusal olmayan etkileşimleri göz önünde bulundurarak gizli, yeni ve bilgilendirici örüntüler tanımlanmıştır. Seçilen genler ve proteinler için birbirine bağlı ağların ileri analizleri, AD yatkınlığının moleküler etiyolojisinin altında yatan etkilenen biyolojik yolları tanımlamada yardımcı olabilir. Etkilenen moleküler yolakları anlamak, AD için yeni önleyici terapötiklere yol açabilecek potansiyel nedensel varyantları ortaya çıkarabildiği önerilmektir.
Özet (Çeviri)
Alzheimer's Disease (AD) is a complex, progressive and irreversible brain disorder that slowly destroys memory and thinking skills and eventually loses the ability to do daily tasks. Our group is currently developing in-silico AD models in which genotyping and phenotyping data are integrated for the differential diagnosis Late-On-Set AD (LOAD) cases. Meta-analysis of four different LOAD data sets provided by ADNI and dbGAP, which includes the genotyping data of more than 5000 LOAD patients, is done. In this study, we provided the biological interpretation of the variants selected through two different approaches, namely entropy and ensemble modeling. First, the LOAD-associated variants are annotated for their genomic location, consequence, gene and protein products, and biological pathways. The protein-coding variants prioritized were selected for experimental validation based on their relationship with LOAD-related biological pathways after network, PPI, and enrichment analysis. For 32 variants, pyrosequencing primers were designed, and sequencing primers were optimized. As a part of the study, a case-control group with 43 LOAD diagnosed and 38 healthy participants were formed, and genotyping for the prioritized variants was completed. We have shown that machine learning models capture hidden, new, and informative patterns by considering nonlinear interactions where multiple variants determine the risk. Further analysis of interconnected networks for selected genes and proteins can identify affected biological pathways underlying the molecular etiology of AD susceptibility. Understanding the affected molecular pathways can reveal potential causative variants that lead to novel preventative therapeutics for AD.
Benzer Tezler
- Parkinson hastalıkları verilerinin makine öğrenmesi yöntemleriyle araştırılması
Analyzing Parkinson's diseases data by machine learning methods
FATİH AYDIN
Doktora
Türkçe
2017
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Aydın ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. ZAFER ASLAN
- Sparse coding based ensemble classifiers combined with active learning framework for data classification
Veri sınıflandırma için aktif öğrenme çerçevesi ile birleştirilmiş ayrık kodlama tabanlı sınıflandırıcı toplulukları
GÖKSU TÜYSÜZOĞLU
Yüksek Lisans
İngilizce
2016
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. YUSUF YASLAN
- Diabetic retinopathy detection using ensemble transfer deep learning
Topluluk transferi derin öğrenme yöntemi kullanarak diyabetik retinopati tespiti
SHUHAD IMAD HADI AL-DUJAILI
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKarabük ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ NEHAD T.A RAMAHA
- Computer-aided exergy and energy analysis of the vacuum distillation unit
Vakum distilasyon ünitesinin bilgisayar destekli ekserji ve enerji analizi
SENA KURBAN
Yüksek Lisans
İngilizce
2021
Enerjiİstanbul Teknik ÜniversitesiKimya Mühendisliği Ana Bilim Dalı
PROF. DR. SERDAR YAMAN
- Catchment scaled drought analysis: Integrated climate and hydrological perspectives
Havza ölçeğinde kuraklık analizi: Entegre iklim ve hidrolojik perspektifleri
SAEED VAZIFEHKHAH
Doktora
İngilizce
2018
İnşaat Mühendisliğiİstanbul Teknik Üniversitesiİnşaat Mühendisliği Ana Bilim Dalı
PROF. DR. ERCAN KAHYA