Graphical models in inference of biological networks
Biyolojik ağların inferansında grafik modeller
- Tez No: 634981
- Danışmanlar: Prof. Dr. VİLDA PURUTÇUOĞLU
- Tez Türü: Doktora
- Konular: Biyoloji, İstatistik, Biology, Statistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2020
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: İstatistik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 88
Özet
Son yıllarda, özellikle, karma¸sık sistemin hastalıkları ile ilgili çalı¸smalar, biyolojik sistemleri daha iyi anlamak ve tedavi veya benzer ko¸sullardan etkilenen sistem davranı ¸sları gözlemlemek bu sistemlerin matematiksel modellerle açıklaması sayesinde hızlanmı¸stır. Gauss Grafiksel Modeller (GGM), regresyon yoluyla sistemin elemanları arasındaki ili¸skiyi tanımlayan ve çok de˘gi¸skenli Gauss (normal) da˘gılım yoluyla sistemin durumlarını temsil eden bir modeldir. Bu da˘gılım biyolojik sistemlerin yapısını“ko¸sullu ba˘gımsızlık”özelli˘gi ile de açıklamaktadır. Bu nedenle, çok de˘gi¸skenli normal da˘gılımın kovaryans matrisinin tersinde,“sıfır”de˘geri hiçbir i¸slevsel etkile- ¸sim anlamına gelmez ve“sıfır olmayan”de˘ger, sistemin yapısı tahmininde proteinler arasındaki etkile¸simi ifade eder. Bu çalı¸smada, yenilik olarak, biyolojik a˘gların kararlı durum aktivasyonunu modellemek için Copula Gaussian Grafiksel Modelleri (CGGM) kullanıyoruz ve Bayesian kurulumu altında model parametrelerinin çıkarımını yapıyoruz. Sistem elemanları olan proteinler veya genlerin arasındaki olası etkile ¸simi (ko¸sullu ba˘gımlılık) tahmin etmek için tersine atlamalı Markov zinciri Monte Karlo (RJMCMC) algoritmasını önermekteyiz.. Önerilen RJMCMC'nin alternatiflerinin ço˘guna kıyasla yüksek performansını göstermek için çe¸sitli veri setleri kullanmaktadır. Ayrıca, GGM'nin zaman içinde tekrarladı˘gı otoregresif katsayı matrisini tahmin etmek için bazı yarı Bayes RJMCMC yöntemini kullandık. Modeli tam Bayesci yakla¸sımla ve ardından tahmini matrislerin do˘grulu˘gunu artırmak için bir ayar parametresi ile geli¸stirdik. Bazı simüle edilmi¸s veri setleri, önerilen farklı yöntemlerin do˘grulu˘gunu göstermek için kullanıldı. Son olarak, daha genel veriler için özellikle simetrik olmayan veya kuyru˘ga ba˘glı durumlar için daha esnek olan kopula yoluyla de˘gi¸skenler arasındaki ili¸skileri ke¸sfetmek için bir yöntem önerdik. Dört gerçek veri setinde önerilen yolları uyguladık ve kopula'nın simetrik veya simetrik olmayan veya hatta kuyru˘ga ba˘glı olup olmadı˘gını görmek için birle¸sik (ortak) da˘gılımının ¸sekli açısından, mevcut ili¸skilere ek olarak birle¸sik da˘gılımının yapısını ke¸sfedebilece˘gini gördük.
Özet (Çeviri)
In recent years, particularly, on the studies about the complex system's diseases, better understanding the biological systems and observing how the system's behaviors, which are affected by the treatment or similar conditions, accelerate with the help of the explanation of these systems via the mathematical modeling. Gaussian Graphical Models (GGM) is a model that describes the relationship between the system's elements via the regression and represents the states of the system via the multivariate Gaussian (normal) distribution. This distribution also explains the structure of biological systems by means of its“conditional independence”feature. Therefore, in the inverse of the covariance matrix of the multivariate normal distribution, the“zero”value implies no functional interaction, and the“non-zero”value stands for the interaction between the proteins in the estimate of the system's structure. In this study, as the novelty, we use the Copula Gaussian Graphical Models (CGGM) in modeling the steady-state activation of the biological networks and make the inference of the model parameters under the Bayesian setting. We suggest the reversible jump Markov chain Monte Carlo (RJMCMC) algorithm to estimate the plausible interactions (conditional dependence) between the systems' elements which are proteins or genes. Several data sets are used to illustrate the out-performance of the proposed RJMCMC in comparison with most of its alternatives. Also, we used some semi- Bayesian RJMCMC method to estimate the autoregressive coefficient matrix where GGM repeated through time. We improved the model by full-Bayesian approach and followingly, by a tuning parameter to increase the accuracy of the estimated matrices. Some simulated data sets are used to show the accuracy of the different proposed methods. Finally, we suggested a method to discover the relationships between variables through copula which is more flexible and it is more appropriate for the nonsymmetric or tail dependent cases. We applied the suggested ways in four real data set and we saw that copula can discover the joint density structure in addition to the available relationships in terms of the shape of the joint distribution to see whether it is symmetric or non-symmetric or even tail dependent or not.
Benzer Tezler
- Application of copulas in graphical models for inference of biological systems
Biyolojik ağların tahminindeki grafiksel modellemelerde kopulaların kullanımı
DAMLA DOKUZOĞLU
Yüksek Lisans
İngilizce
2016
İstatistikOrta Doğu Teknik Üniversitesiİstatistik Ana Bilim Dalı
DOÇ. DR. VİLDA PURUTÇUOĞLU GAZİ
- Deterministic modeling and inference of biochemical networks
Biyokimyasal ağların deterministik modellemesi ve sonuç çıkarımı
DENİZ SEÇİLMİŞ
Yüksek Lisans
İngilizce
2017
İstatistikOrta Doğu Teknik ÜniversitesiBiyoenformatik Ana Bilim Dalı
DOÇ. DR. VİLDA PURUTÇUOĞLU GAZİ
- Ağyapı çıkarımı tekniklerinin metabolom verilerine uygulanarak hücrenin biyolojik amacının incelenmesi
Investigation of the biological objective of the cell by applying network inference techniques to metabolome data
MELİK ÖKSÜZ
Yüksek Lisans
Türkçe
2012
Kimya MühendisliğiGebze Yüksek Teknoloji EnstitüsüKimya Mühendisliği Ana Bilim Dalı
DOÇ. DR. HASAN SADIKOĞLU
YRD. DOÇ. DR. TUNAHAN ÇAKIR
- Gaussian graphical approaches in estimation of biological systems
Gaussian grafiksel modeli ile biyolojik sistemlerin tahmini
EZGİ AYYILDIZ
Yüksek Lisans
İngilizce
2013
İstatistikOrta Doğu Teknik Üniversitesiİstatistik Ana Bilim Dalı
DOÇ. DR. VİLDA PURUTÇUOĞLU GAZİ
- Inference of large-scale networks via statistical approaches
Geniş ölçekli ağların istatistiksel yaklaşımlarla tahmini
EZGİ AYYILDIZ DEMİRCİ
Doktora
İngilizce
2019
İstatistikOrta Doğu Teknik Üniversitesiİstatistik Ana Bilim Dalı
PROF. DR. VİLDA PURUTÇUOĞLU GAZİ