Geri Dön

Graphical models in inference of biological networks

Biyolojik ağların inferansında grafik modeller

  1. Tez No: 634981
  2. Yazar: HAJAR FARNOUDKIA
  3. Danışmanlar: Prof. Dr. VİLDA PURUTÇUOĞLU
  4. Tez Türü: Doktora
  5. Konular: Biyoloji, İstatistik, Biology, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2020
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 88

Özet

Son yıllarda, özellikle, karma¸sık sistemin hastalıkları ile ilgili çalı¸smalar, biyolojik sistemleri daha iyi anlamak ve tedavi veya benzer ko¸sullardan etkilenen sistem davranı ¸sları gözlemlemek bu sistemlerin matematiksel modellerle açıklaması sayesinde hızlanmı¸stır. Gauss Grafiksel Modeller (GGM), regresyon yoluyla sistemin elemanları arasındaki ili¸skiyi tanımlayan ve çok de˘gi¸skenli Gauss (normal) da˘gılım yoluyla sistemin durumlarını temsil eden bir modeldir. Bu da˘gılım biyolojik sistemlerin yapısını“ko¸sullu ba˘gımsızlık”özelli˘gi ile de açıklamaktadır. Bu nedenle, çok de˘gi¸skenli normal da˘gılımın kovaryans matrisinin tersinde,“sıfır”de˘geri hiçbir i¸slevsel etkile- ¸sim anlamına gelmez ve“sıfır olmayan”de˘ger, sistemin yapısı tahmininde proteinler arasındaki etkile¸simi ifade eder. Bu çalı¸smada, yenilik olarak, biyolojik a˘gların kararlı durum aktivasyonunu modellemek için Copula Gaussian Grafiksel Modelleri (CGGM) kullanıyoruz ve Bayesian kurulumu altında model parametrelerinin çıkarımını yapıyoruz. Sistem elemanları olan proteinler veya genlerin arasındaki olası etkile ¸simi (ko¸sullu ba˘gımlılık) tahmin etmek için tersine atlamalı Markov zinciri Monte Karlo (RJMCMC) algoritmasını önermekteyiz.. Önerilen RJMCMC'nin alternatiflerinin ço˘guna kıyasla yüksek performansını göstermek için çe¸sitli veri setleri kullanmaktadır. Ayrıca, GGM'nin zaman içinde tekrarladı˘gı otoregresif katsayı matrisini tahmin etmek için bazı yarı Bayes RJMCMC yöntemini kullandık. Modeli tam Bayesci yakla¸sımla ve ardından tahmini matrislerin do˘grulu˘gunu artırmak için bir ayar parametresi ile geli¸stirdik. Bazı simüle edilmi¸s veri setleri, önerilen farklı yöntemlerin do˘grulu˘gunu göstermek için kullanıldı. Son olarak, daha genel veriler için özellikle simetrik olmayan veya kuyru˘ga ba˘glı durumlar için daha esnek olan kopula yoluyla de˘gi¸skenler arasındaki ili¸skileri ke¸sfetmek için bir yöntem önerdik. Dört gerçek veri setinde önerilen yolları uyguladık ve kopula'nın simetrik veya simetrik olmayan veya hatta kuyru˘ga ba˘glı olup olmadı˘gını görmek için birle¸sik (ortak) da˘gılımının ¸sekli açısından, mevcut ili¸skilere ek olarak birle¸sik da˘gılımının yapısını ke¸sfedebilece˘gini gördük.

Özet (Çeviri)

In recent years, particularly, on the studies about the complex system's diseases, better understanding the biological systems and observing how the system's behaviors, which are affected by the treatment or similar conditions, accelerate with the help of the explanation of these systems via the mathematical modeling. Gaussian Graphical Models (GGM) is a model that describes the relationship between the system's elements via the regression and represents the states of the system via the multivariate Gaussian (normal) distribution. This distribution also explains the structure of biological systems by means of its“conditional independence”feature. Therefore, in the inverse of the covariance matrix of the multivariate normal distribution, the“zero”value implies no functional interaction, and the“non-zero”value stands for the interaction between the proteins in the estimate of the system's structure. In this study, as the novelty, we use the Copula Gaussian Graphical Models (CGGM) in modeling the steady-state activation of the biological networks and make the inference of the model parameters under the Bayesian setting. We suggest the reversible jump Markov chain Monte Carlo (RJMCMC) algorithm to estimate the plausible interactions (conditional dependence) between the systems' elements which are proteins or genes. Several data sets are used to illustrate the out-performance of the proposed RJMCMC in comparison with most of its alternatives. Also, we used some semi- Bayesian RJMCMC method to estimate the autoregressive coefficient matrix where GGM repeated through time. We improved the model by full-Bayesian approach and followingly, by a tuning parameter to increase the accuracy of the estimated matrices. Some simulated data sets are used to show the accuracy of the different proposed methods. Finally, we suggested a method to discover the relationships between variables through copula which is more flexible and it is more appropriate for the nonsymmetric or tail dependent cases. We applied the suggested ways in four real data set and we saw that copula can discover the joint density structure in addition to the available relationships in terms of the shape of the joint distribution to see whether it is symmetric or non-symmetric or even tail dependent or not.

Benzer Tezler

  1. Application of copulas in graphical models for inference of biological systems

    Biyolojik ağların tahminindeki grafiksel modellemelerde kopulaların kullanımı

    DAMLA DOKUZOĞLU

    Yüksek Lisans

    İngilizce

    İngilizce

    2016

    İstatistikOrta Doğu Teknik Üniversitesi

    İstatistik Ana Bilim Dalı

    DOÇ. DR. VİLDA PURUTÇUOĞLU GAZİ

  2. Deterministic modeling and inference of biochemical networks

    Biyokimyasal ağların deterministik modellemesi ve sonuç çıkarımı

    DENİZ SEÇİLMİŞ

    Yüksek Lisans

    İngilizce

    İngilizce

    2017

    İstatistikOrta Doğu Teknik Üniversitesi

    Biyoenformatik Ana Bilim Dalı

    DOÇ. DR. VİLDA PURUTÇUOĞLU GAZİ

  3. Ağyapı çıkarımı tekniklerinin metabolom verilerine uygulanarak hücrenin biyolojik amacının incelenmesi

    Investigation of the biological objective of the cell by applying network inference techniques to metabolome data

    MELİK ÖKSÜZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2012

    Kimya MühendisliğiGebze Yüksek Teknoloji Enstitüsü

    Kimya Mühendisliği Ana Bilim Dalı

    DOÇ. DR. HASAN SADIKOĞLU

    YRD. DOÇ. DR. TUNAHAN ÇAKIR

  4. Gaussian graphical approaches in estimation of biological systems

    Gaussian grafiksel modeli ile biyolojik sistemlerin tahmini

    EZGİ AYYILDIZ

    Yüksek Lisans

    İngilizce

    İngilizce

    2013

    İstatistikOrta Doğu Teknik Üniversitesi

    İstatistik Ana Bilim Dalı

    DOÇ. DR. VİLDA PURUTÇUOĞLU GAZİ

  5. Inference of large-scale networks via statistical approaches

    Geniş ölçekli ağların istatistiksel yaklaşımlarla tahmini

    EZGİ AYYILDIZ DEMİRCİ

    Doktora

    İngilizce

    İngilizce

    2019

    İstatistikOrta Doğu Teknik Üniversitesi

    İstatistik Ana Bilim Dalı

    PROF. DR. VİLDA PURUTÇUOĞLU GAZİ