Rankpcsf: A disease module identification method by integrating network propagation with prize-collecting steiner forest
Rankpcsf: Ağ üzerinde yayılım ve ödül toplayan steiner ormanı kullanarak hastalık modülü tespit metodu
- Tez No: 751920
- Danışmanlar: DR. ÖĞR. ÜYESİ BURÇAK OTLU SARITAŞ, DOÇ. DR. NURCAN TUNÇBAĞ
- Tez Türü: Yüksek Lisans
- Konular: Biyoloji, Biology
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Enformatik Enstitüsü
- Ana Bilim Dalı: Tıp Bilişimi Ana Bilim Dalı
- Bilim Dalı: Biyoenformatik Bilim Dalı
- Sayfa Sayısı: 45
Özet
Hastalık modüllerinin tanımlanması, hastalıkların ilerlemesinin daha iyi anlaşılmasına, daha doğru biyobelirteçlerin ve ilaç hedeflerinin bulunmasına yol açabilir. Bu çalışmada, Steiner ağacının gücünü ve difüzyon yaklaşımlarını birleştiren hibrit bir yöntem olan RANKPCSF geliştirdik ve yeni bir ağ yeniden yapılandırma yaklaşımı yayınladık. RANKPCSF, hastalıkla ilişkili optimal ağı ortaya çıkarmak için multi-omik verileri (fosfoproteomik ve transkriptomik dahil) bir referans interaktom ile entegre etme yeteneğine sahiptir. RANKPCSF algoritmasını bilinen kanser genlerini ve ilaç hedeflerini tahmin etme performansını NetCore, Hierarchical HotNet ve DOMINO ile karşılaştırdık. Ortalama olarak, RANKPCSF kanser sürücü genlerini ve kanser ilacı hedeflerini daha yüksek hassasiyetle yakalayabildi ve pan-kanser deneyinde önemli olmadığı düşünülen gen setinden daha fazla kanser geni tanımladı. Daha sonra, RANKPCSF ve diğer yöntemlerden elde edilen ağların işlevsel uygunluğunu karşılaştırdık. NetCore ve RANKPCSF, ampirik p değerlerine (0,001) dayalı olarak en yüksek işlevsel alaka düzeyini verdi. Son olarak, bağımsız bir doğrulama vaka çalışması olarak 46 hastadan alınan transkriptomik verileri kullanarak iskemik kalp hastalığı (IHD) ile ilişkili ağı yeniden yapılandırmak için RANKPCSF çalıştırdık. İskemik kalp hastalığı patolojisi ile ilgili olan oksidatif stres, hücre dışı matris organizasyonu ve bağışıklık tepkisi ile ilgili modülleri gözlemledik. Genel olarak, RANKPCSF bilinen kanser genlerini ve ilaç hedeflerini daha doğru bir şekilde tespit etti ve seçilen diğer algoritmalara kıyasla fonksiyonel uygunluk testinde daha iyi performans gösterdi. RANKPCSF - bir hibrit yöntem olarak - işlevsel olarak ilgili alt ağlar dahil olmak üzere farklı görevler için kullanılabileceğine ve bu alt ağların hastalıkla ilişkili hipotezler oluşturmak için kullanılabileceğine inanıyoruz.
Özet (Çeviri)
Identification of disease modules may lead to a better understanding on the progression of diseases, finding more accurate biomarkers, and drug targets. In this study, we develop a hybrid method – RANKPCSF- combining the strength of Steiner tree and diffusion approaches and release a new network reconstruction approach. RANKPCSF is capable to integrate multi-omic data (including phosphoproteomic and transcriptomic) with a reference interactome to unveil the optimal disease-associated network. We have compared RANKPCSF's performance on predicting known cancer genes and drug targets with NetCore, Hierarchical HotNet and DOMINO. On average, RANKPCSF was able to capture cancer driver genes and cancer drug targets with higher precision and identified more cancer genes from the set of genes that were deemed not significant in the pan-cancer experiment. Next, we compared the functional relevancy of the resulting networks from RANKPCSF and other methods. NetCore and RANKPCSF gave the highest functional relevances based on empirical p-values (0.001). Finally, we have applied RANKPCSF to reconstruct ischemic heart disease (IHD)-associated network by using the transcriptomic data from 46 patients as an independent validation case study. We observed modules related to oxidative stress, extracellular matrix organization, and immune response, which were relevant to ischemic heart disease pathology. Overall, RANKPCSF captures known cancer genes and drug targets more accurately and performed better on functional relevance test compared to other selected algorithms. We believe that RANKPCSF – as a hybrid method - can be used for different tasks including functionally relevant subnetworks, and these subnetworks can be used to generate disease-associated hypotheses.