Geri Dön

Revealing gene interactions using Bayesian networks

Gen etkileşimlerinin Bayezyen ağlar ile ortaya çıkarılması

  1. Tez No: 333114
  2. Yazar: ŞENOL İŞÇİ
  3. Danışmanlar: PROF. DR. CENGİZHAN ÖZTÜRK, YRD. DOÇ. DR. HASAN HÜSEYİN OTU
  4. Tez Türü: Doktora
  5. Konular: Biyoistatistik, Biyomühendislik, Mühendislik Bilimleri, Biostatistics, Bioengineering, Engineering Sciences
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2013
  8. Dil: İngilizce
  9. Üniversite: Boğaziçi Üniversitesi
  10. Enstitü: Biyo-Medikal Mühendislik Enstitüsü
  11. Ana Bilim Dalı: Belirtilmemiş.
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 110

Özet

Hücre içindeki biyokimyasal etkileşimlerin anlaşılmasını hedeeyen yüksek çıkt ılı biyolojik veriler, en iyi ağ ve patikalar bağlamında analiz edilebilir ve açıklanabilir. Bu veri, genelde gürültü içine gömülü lineer olmayan stokastik ilişkileri temsil eder. Bayezyen Ağ teorisi, gen düzenleme ölçümleriyle ilgili verileri analiz etmek için bir çatı sağlar. Çünkü bu çatı bahsi geçen engelleri doğal olarak ele alır. Bu tezde, altta yatan biyolojik etkileşimleri en iyi açıklayan patikaları bulmak için, bilinen biyolojk patikaları Bayezyen ağlar olarak modelleyen ve verilen bir mikrodizi deneyinin sonuçlarını yansıtan yeni bir yöntem verilmiştir. Bu işlem sırasında, biyolojik patikalar, yönlü çevrimsiz graara dönüştürülür ve gözlenmiş mikrodizi verisinin verilen bir ağa ne kadar uyduğunu ölçen bir skor hesaplanır. Bu skorların istatistiksel önemi,“önyükleme ile rasgeleleştirme yöntemi”ile değerlendirilir ve uygun patikalar, karşılaştırma ölçüsü olarak kullanılabilecek bir kesinlik ile tespit edilir. Sentetik ve gerçek veri kullan ılan simülasyonlar, Bayezyen Patika Analizi (BPA) olarak adlandırılan bu önerilen yöntemin sağlamlığını göstermiştir. Önerilen yöntem, var olan benzer yöntemlere göre gelişme sağlamıştır. Çünkü, bir patikada bulunan genler basitçe bir liste şeklinde düşünülmez ve verilen bir patikadaki hangi genlerin birbiriyle etkileştiğinin topolojisi modelle birleştirilir. Ağ öğrenme teknikleri, altta yatan biyolojik olayları mikrodizi deneyleri yardımıyla ortaya çıkarmaya çok yararlı olmasına rağmen, bu ağlar gerçek biyolojik patikalara çok uzak olabilir. Bunun sebebi, veri içinde genler için az sayıda örnek olmasından dolayı ve uygun olmayan başlangıç ağ yapısı seçiminden kaynaklanan problemlerdir. Öğrenme teknikleri, önceden deneysel testlerle doğrulanmış öncül biyolojik bilgi ile desteklenmelidir. Bilinen genler ve düzenleyici patikalar hakkındaki bilgilerin kullanılmas ı, statik ve dinamik Bayezyen ağların öğrenilmesinin doğruluk ve performansına en ileri zemini sağlayabilir. Ama, bilindiği kadarıyla, gen etkileşim ağlarında her tip bilgi kaynağından gelen harici öncül bilginin kullanılmasına yönelik genel bir kurulu metodoloji bulunmamaktadır. Bu tezin amaçlarında biri, gen etkileşimlerinin ortaya çıkarılması için hem statik hem de dinamik Bayezyen ağ öğrenme işlemine, bilinen biyolojik bilgileri entegre etmek için global bir yaklaşımın kurulmasıdır. Harici biyolojik verilerden faydalanarak iki genin birbiriyle etkileşip etkileşmediğini tahmin etmek için bir çatı önerilmiştir. Buna yönelik olarak, bilinen biyolojik veriyi, gen etkileşimlerinin ortaya çıkarılmasında kullanabilmek adına, var olan biyolojik verilerden Bayezyen ağ üretilmiştir. Kullanılan harici veri tipleri, protein-protein, protein-DNA/RNA ve gen etkileşimlerinden oluş- makta olup, BioGrid ve Reactome gibi etkileşim veritabanlarından elde edilmiştir. lk olarak, bilinen gen etkileşimlerini kullanarak parametre öğrenme yöntemi kullanılarak, verilecek iki genin etkileşip etkileşmediğini tahmin edecek Öncül Bayezyen Ağ (ÖBA) modeli inşa edilmiştir. Elde edilen model, yüksek çıktılı biyolojik veriden ağ öğrenme için greedy arama algoritmasına entegre edilir ve etkileşen genler bir ağ formunda sunulur. Bu ağ üretimi işleminde, harici biyolojik veriden etkileşen genleri bulan Öncül Bayezyen Ağ (ÖBA), yapı öğrenme görevinde aday ağların olasılığını hesaplamak için kullanılır. Hem sentetik hem gerçek veri setleri ile yapılan simülasyonlar göstermiştir ki önerilen çatı, gerçek ağların belirlenmesini başarılı bir şekilde geliştirebilir ve gen etkileşimlerinin tahmin edilmesinde kullanılabilir.

Özet (Çeviri)

High throughput biological data (HTBD) targeting understanding of biochemical interactions in the cell can best be analyzed, and explained within the context of networks and pathways. Such data generally represents stochastic nonlinear relations embedded in noise. Bayesian Network (BN) theory provides a framework to analyze the data regarding gene regulation measurements, as this framework naturally handles the aforementioned obstacles. In this dissertation, we provide a two faceted approach to the applications of BNs to HTBD. In the rst facet, a novel method is provided, which models known biological pathways as BNs, and uses given HTBD to nd pathways that best explain underlying interactions. During this process, biological pathways are converted to directed acyclic graphs, and a score measuring tness of the observed HTBD to a given network is calculated. Statistical significance of these scores is assessed by“randomization via bootstrapping”, and relevant pathways are identied with a certainty that can be used as a comparative measure. Simulations using synthetic and real data demonstrated robustness of the proposed approach, called Bayesian Pathway Analysis (BPA). BPA provides improvement over existing similar approaches by not considering genes in a pathway simply as a list, but incorporating to its model the topology via which genes in a given pathway interact with each other. Although network learning techniques are very useful to reveal the underlying biological phenomena with the help of HTBD, these techniques do not always perform well. This is due to the problems created by the small number of samples, inconvenient initial choice for the network structures, noise inherent in the data, and the complexity of the networks. To improve their performance, the learning techniques can be supported by prior biological knowledge, which are already veried by experimental assays. In the second facet explored in this dissertation, we established a global approach to integrate known biological information to Bayesian learning in order to reveal gene interactions. The proposed framework makes use of external biological knowledge to predict if two given genes interact with each other. To this end, prior knowledge about interaction of two genes is utilized by generating a Bayesian Network Prior (BNP) model, using existing external biological knowledge. External knowledge types to be utilized were obtained from interaction databases such as BioGrid and Reactome, and consist of protein-protein, protein-DNA/RNA, and gene interactions. The resulting model is incorporated into greedy search algorithm for learning networks from HTBD, and interacting genes are represented in the form of a network. In this process of network generation, the BNP model deducing gene interactions from external knowledge are used to calculate the probability of candidate networks to enhance the structure learning task. Simulations on both synthetic and real data sets showed that the proposed framework can successfully enhance identication of the true network, and be used in predicting gene interactions.

Benzer Tezler

  1. Disease gene identification using linkage and exome analysis

    Bağlantı ve ekzom analizi kullanarak hastalık geni keşfi

    DERYA YAVUZ

    Yüksek Lisans

    İngilizce

    İngilizce

    2020

    Genetikİstanbul Teknik Üniversitesi

    Moleküler Biyoloji-Genetik ve Biyoteknoloji Ana Bilim Dalı

    PROF. DR. EDA TAHİR TURANLI

  2. Integrating gene expression, protein interaction and protein domain data to improve gene expression clustering

    Gen ifadesi gruplamasını geliştirmek için gen ifadesi, protein etkileşimi ve protein aileleri verilerini bütünleştirme

    ALPER TOLGA KOCATAŞ

    Yüksek Lisans

    İngilizce

    İngilizce

    2005

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKoç Üniversitesi

    Elektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. ATTİLA GÜRSOY

  3. İnsan PSMD4 geninin moleküler karakterizasyonu

    Molecular characterization of the human PSMD4 gene

    MESUT ACAR

    Doktora

    Türkçe

    Türkçe

    2023

    BiyolojiBalıkesir Üniversitesi

    Biyoloji Ana Bilim Dalı

    PROF. DR. FERAY KÖÇKAR

  4. Endoplazmik retikulum stres modeli oluşturulan HTR-8/svneo insan trofoektoderm hücre hattında hücresel dinamiklerin moleküler araştırılması

    Investigation the effects of endoplasmic reticulum stresss on intracellular dynamics in HTR-8/svneo human trophectoderm cell line

    GURUR GARİP

    Doktora

    Türkçe

    Türkçe

    2021

    Histoloji ve EmbriyolojiEge Üniversitesi

    Histoloji ve Embriyoloji Ana Bilim Dalı

    PROF. DR. AYŞEGÜL UYSAL