Revealing gene interactions using Bayesian networks
Gen etkileşimlerinin Bayezyen ağlar ile ortaya çıkarılması
- Tez No: 333114
- Danışmanlar: PROF. DR. CENGİZHAN ÖZTÜRK, YRD. DOÇ. DR. HASAN HÜSEYİN OTU
- Tez Türü: Doktora
- Konular: Biyoistatistik, Biyomühendislik, Mühendislik Bilimleri, Biostatistics, Bioengineering, Engineering Sciences
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2013
- Dil: İngilizce
- Üniversite: Boğaziçi Üniversitesi
- Enstitü: Biyo-Medikal Mühendislik Enstitüsü
- Ana Bilim Dalı: Belirtilmemiş.
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 110
Özet
Hücre içindeki biyokimyasal etkileşimlerin anlaşılmasını hedeeyen yüksek çıkt ılı biyolojik veriler, en iyi ağ ve patikalar bağlamında analiz edilebilir ve açıklanabilir. Bu veri, genelde gürültü içine gömülü lineer olmayan stokastik ilişkileri temsil eder. Bayezyen Ağ teorisi, gen düzenleme ölçümleriyle ilgili verileri analiz etmek için bir çatı sağlar. Çünkü bu çatı bahsi geçen engelleri doğal olarak ele alır. Bu tezde, altta yatan biyolojik etkileşimleri en iyi açıklayan patikaları bulmak için, bilinen biyolojk patikaları Bayezyen ağlar olarak modelleyen ve verilen bir mikrodizi deneyinin sonuçlarını yansıtan yeni bir yöntem verilmiştir. Bu işlem sırasında, biyolojik patikalar, yönlü çevrimsiz graara dönüştürülür ve gözlenmiş mikrodizi verisinin verilen bir ağa ne kadar uyduğunu ölçen bir skor hesaplanır. Bu skorların istatistiksel önemi,“önyükleme ile rasgeleleştirme yöntemi”ile değerlendirilir ve uygun patikalar, karşılaştırma ölçüsü olarak kullanılabilecek bir kesinlik ile tespit edilir. Sentetik ve gerçek veri kullan ılan simülasyonlar, Bayezyen Patika Analizi (BPA) olarak adlandırılan bu önerilen yöntemin sağlamlığını göstermiştir. Önerilen yöntem, var olan benzer yöntemlere göre gelişme sağlamıştır. Çünkü, bir patikada bulunan genler basitçe bir liste şeklinde düşünülmez ve verilen bir patikadaki hangi genlerin birbiriyle etkileştiğinin topolojisi modelle birleştirilir. Ağ öğrenme teknikleri, altta yatan biyolojik olayları mikrodizi deneyleri yardımıyla ortaya çıkarmaya çok yararlı olmasına rağmen, bu ağlar gerçek biyolojik patikalara çok uzak olabilir. Bunun sebebi, veri içinde genler için az sayıda örnek olmasından dolayı ve uygun olmayan başlangıç ağ yapısı seçiminden kaynaklanan problemlerdir. Öğrenme teknikleri, önceden deneysel testlerle doğrulanmış öncül biyolojik bilgi ile desteklenmelidir. Bilinen genler ve düzenleyici patikalar hakkındaki bilgilerin kullanılmas ı, statik ve dinamik Bayezyen ağların öğrenilmesinin doğruluk ve performansına en ileri zemini sağlayabilir. Ama, bilindiği kadarıyla, gen etkileşim ağlarında her tip bilgi kaynağından gelen harici öncül bilginin kullanılmasına yönelik genel bir kurulu metodoloji bulunmamaktadır. Bu tezin amaçlarında biri, gen etkileşimlerinin ortaya çıkarılması için hem statik hem de dinamik Bayezyen ağ öğrenme işlemine, bilinen biyolojik bilgileri entegre etmek için global bir yaklaşımın kurulmasıdır. Harici biyolojik verilerden faydalanarak iki genin birbiriyle etkileşip etkileşmediğini tahmin etmek için bir çatı önerilmiştir. Buna yönelik olarak, bilinen biyolojik veriyi, gen etkileşimlerinin ortaya çıkarılmasında kullanabilmek adına, var olan biyolojik verilerden Bayezyen ağ üretilmiştir. Kullanılan harici veri tipleri, protein-protein, protein-DNA/RNA ve gen etkileşimlerinden oluş- makta olup, BioGrid ve Reactome gibi etkileşim veritabanlarından elde edilmiştir. lk olarak, bilinen gen etkileşimlerini kullanarak parametre öğrenme yöntemi kullanılarak, verilecek iki genin etkileşip etkileşmediğini tahmin edecek Öncül Bayezyen Ağ (ÖBA) modeli inşa edilmiştir. Elde edilen model, yüksek çıktılı biyolojik veriden ağ öğrenme için greedy arama algoritmasına entegre edilir ve etkileşen genler bir ağ formunda sunulur. Bu ağ üretimi işleminde, harici biyolojik veriden etkileşen genleri bulan Öncül Bayezyen Ağ (ÖBA), yapı öğrenme görevinde aday ağların olasılığını hesaplamak için kullanılır. Hem sentetik hem gerçek veri setleri ile yapılan simülasyonlar göstermiştir ki önerilen çatı, gerçek ağların belirlenmesini başarılı bir şekilde geliştirebilir ve gen etkileşimlerinin tahmin edilmesinde kullanılabilir.
Özet (Çeviri)
High throughput biological data (HTBD) targeting understanding of biochemical interactions in the cell can best be analyzed, and explained within the context of networks and pathways. Such data generally represents stochastic nonlinear relations embedded in noise. Bayesian Network (BN) theory provides a framework to analyze the data regarding gene regulation measurements, as this framework naturally handles the aforementioned obstacles. In this dissertation, we provide a two faceted approach to the applications of BNs to HTBD. In the rst facet, a novel method is provided, which models known biological pathways as BNs, and uses given HTBD to nd pathways that best explain underlying interactions. During this process, biological pathways are converted to directed acyclic graphs, and a score measuring tness of the observed HTBD to a given network is calculated. Statistical significance of these scores is assessed by“randomization via bootstrapping”, and relevant pathways are identied with a certainty that can be used as a comparative measure. Simulations using synthetic and real data demonstrated robustness of the proposed approach, called Bayesian Pathway Analysis (BPA). BPA provides improvement over existing similar approaches by not considering genes in a pathway simply as a list, but incorporating to its model the topology via which genes in a given pathway interact with each other. Although network learning techniques are very useful to reveal the underlying biological phenomena with the help of HTBD, these techniques do not always perform well. This is due to the problems created by the small number of samples, inconvenient initial choice for the network structures, noise inherent in the data, and the complexity of the networks. To improve their performance, the learning techniques can be supported by prior biological knowledge, which are already veried by experimental assays. In the second facet explored in this dissertation, we established a global approach to integrate known biological information to Bayesian learning in order to reveal gene interactions. The proposed framework makes use of external biological knowledge to predict if two given genes interact with each other. To this end, prior knowledge about interaction of two genes is utilized by generating a Bayesian Network Prior (BNP) model, using existing external biological knowledge. External knowledge types to be utilized were obtained from interaction databases such as BioGrid and Reactome, and consist of protein-protein, protein-DNA/RNA, and gene interactions. The resulting model is incorporated into greedy search algorithm for learning networks from HTBD, and interacting genes are represented in the form of a network. In this process of network generation, the BNP model deducing gene interactions from external knowledge are used to calculate the probability of candidate networks to enhance the structure learning task. Simulations on both synthetic and real data sets showed that the proposed framework can successfully enhance identication of the true network, and be used in predicting gene interactions.
Benzer Tezler
- Disease gene identification using linkage and exome analysis
Bağlantı ve ekzom analizi kullanarak hastalık geni keşfi
DERYA YAVUZ
Yüksek Lisans
İngilizce
2020
Genetikİstanbul Teknik ÜniversitesiMoleküler Biyoloji-Genetik ve Biyoteknoloji Ana Bilim Dalı
PROF. DR. EDA TAHİR TURANLI
- Integrating gene expression, protein interaction and protein domain data to improve gene expression clustering
Gen ifadesi gruplamasını geliştirmek için gen ifadesi, protein etkileşimi ve protein aileleri verilerini bütünleştirme
ALPER TOLGA KOCATAŞ
Yüksek Lisans
İngilizce
2005
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKoç ÜniversitesiElektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. ATTİLA GÜRSOY
- İnsan PSMD4 geninin moleküler karakterizasyonu
Molecular characterization of the human PSMD4 gene
MESUT ACAR
- Endoplazmik retikulum stres modeli oluşturulan HTR-8/svneo insan trofoektoderm hücre hattında hücresel dinamiklerin moleküler araştırılması
Investigation the effects of endoplasmic reticulum stresss on intracellular dynamics in HTR-8/svneo human trophectoderm cell line
GURUR GARİP
Doktora
Türkçe
2021
Histoloji ve EmbriyolojiEge ÜniversitesiHistoloji ve Embriyoloji Ana Bilim Dalı
PROF. DR. AYŞEGÜL UYSAL