Bayesian network based pathway analysis of high throughput biological data
Yüksek çıktılı biyolojik verilerin bayes ağları kullanılarak patika düzleminde analizi
- Tez No: 338816
- Danışmanlar: YRD. DOÇ. DR. ARZUCAN ÖZGÜR, YRD. DOÇ. DR. HASAN HÜSEYİN OTU
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2013
- Dil: İngilizce
- Üniversite: Boğaziçi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 96
Özet
Biyolojik veri üretimi, mikrodiziler ve yeni nesil sekanslama teknolojilerinin oluşumu ile baş döndürücü bir hızla artmaktadır. Yüksek Çıktılı Biyolojik Veri (YÇBV) olarak adlandırılan bu sonuçlar kapsamlı analiz metotlarına ihtiyaç duymaktadır. Yaşam bilimleri penceresinden bakılınca veri analizi sonuçları en fazla biyolojik patikalar düzleminde yorumlanınca fayda sağlamaktadır. Bayes Ağları (BA) hem doğrusal hem de doğrusal olmayan ilişkileri modelleyebilmekte ve stokastik olayları olasılıksal bir çerçevede gürültüye tolere ederek inceleyebilmektedir. Bu özellikler BA'ları YÇBV analizine uygun bir yöntem kılmaktadır. Isci v.d. tarafından yapılan yakın tarihli bir çalışma, Bayes Patika Analizi (BPA), YÇBV'yi BA kullanarak analiz eden bir yaklaşım önermektedir. Biyolojik patikalar BA olarak modellenip YÇBV'yi en iyi açıklayan patikalar bulunmaktadır. Bu tezin iki temel amacı vardır. Birinci amaç, BPA sistemini geliştirmektir. Veri işleme aşamasında, her gen için iki grup (kanser ve normal) arasındaki ifade değişim oranı hesaplanmakta ve ağ skorlama modülünde kullanılmak üzere sert eşik seviyeleri ile ayrıklaştırılmaktaydı. Buna ek olarak, çeşitli seviyelerde altı farklı ayrıklaştırma metodu denedik. Skorlama aşamasında, üç farklı skorlama yöntemi uygulayıp Bayes-Dirichlet eş yöntemiyle mukayese ettik. İstatistiksel belirginliği ölçme aşaması, rastsallaştırılmış veri kümelerini gen sinyal değerleri seviyesinde elde ederek bu konuda mevcut BPA yaklaşımının başarısız olduğu durumların üstesinden gelmek için geliştirdik. Optimize edilmiş yazılımın indirilip insan dahil çeşitli organizmalara uygulanabilmesi için web erişimi sağladık. İkinci amacımız, geliştirilmiş patika analizi yaklaşımını çeşitli gerçek kanser mikrodizi verilerine uygulayıp aktif patikaları belirlemektir. Sonuçlarımızı kıyaslanabilir bir yaklaşım olan SPIA ile karşılaştırdık.
Özet (Çeviri)
Biological data production has been increasing at an unprecedented pace with the advancements of microarrays and next-generation sequencing technologies. Such High Throughput Biological Data (HTBD), requires detailed analysis methods. From a life science perspective, data analysis results make most sense when interpreted within the context of biological pathways. Bayesian Networks (BNs) capture both linear and nonlinear interactions, and handle stochastic events in a probabilistic framework accounting for noise. These properties make BNs excellent candidates for HTBD analysis. A recent study by Isci et al. proposes an approach, called Bayesian Pathway Analysis (BPA), for analyzing HTBD using BNs in which known biological pathways are modeled as BNs and pathways that best explain the given HTBD are found. In this thesis, we have the following two fundamental aims. Our first aim is to improve the BPA system. In the data processing phase, fold changes between two groups (i.e., cancer and normal) were calculated for genes and discretized using hard cut-off levels to be used in the network scoring module. We evaluated six different discretization methods with various numbers of levels. In the scoring phase, we applied three scoring methods and compared the results with the Bayesian-Dirichlet Equivalent scheme currently applied in the system. The statistical significance assessment phase was improved by obtaining randomized data sets at the gene signal level to overcome the cases where the current BPA fails to provide random data sets. We provide a web portal where the optimized software can be downloaded and used for various organisms including human. Our second aim is to apply the improved pathway analysis approach on various real cancer microarray data sets in order to investigate the pathways that are commonly and differently active. We compared our findings with a comparable approach, SPIA.
Benzer Tezler
- Bayesian networks for omics data analysis in hepatocellular carcinoma single-cell sequencing
Hepatosellüler karsinomun tekil hücre diziliminde omiklerin veri analizi için Bayes ağları
MUNTADHER ZAHID JIHAD
Yüksek Lisans
İngilizce
2021
GenetikHacettepe ÜniversitesiBiyoenformatik Ana Bilim Dalı
DR. ÖĞR. ÜYESİ İDİL YET
- Investigation of the brain connectivity disturbance in Dyslexic patients
Dyslexic hastalarda beyin bağlantı bozukluğunun incelenmesi
Vesal Rasoulzadeh
Yüksek Lisans
İngilizce
2016
Elektrik ve Elektronik MühendisliğiOrta Doğu Teknik ÜniversitesiBiyomedikal Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. İLKAY ULUSOY PARNAS
- Genome-wide prediction of prokaryotic two-component system networks using a sequence-based meta-predictor
Başlık çevirisi yok
ALTAN KARA
Doktora
İngilizce
2016
BiyolojiAberystwyth University / Prifysgol AberystwythYurtdışı Enstitü
DR. NARCIS FERNANDEZ-FUENTES
DR. DAVID WHITWORTH
- İzmir ili toplu taşıma altyapısı için bir bayes ağı tabanlı müşteri memnuniyet modeli
A bayesian network based customer satisfaction surveyfor public transportation infrastructure in İzmir city
ACAR AKTOSUN
Yüksek Lisans
Türkçe
2019
İstatistikMuğla Sıtkı Koçman Üniversitesiİstatistik Ana Bilim Dalı
DR. ÖĞR. ÜYESİ VOLKAN SEVİNÇ
- Kurumsal kredilerin geri ödenmeme olasılığının tahminine yönelik Bayes ağı temelli bir erken uyarı modeli
A Bayesian network based early warning model that estimates the probability of non-performing corporate credits
YASEMİN BAŞ
Yüksek Lisans
Türkçe
2015
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. UMUT ASAN