Gene function inference from expression using probabilistic topic models
Olasılıksal tema modelleri kullanarak gen ifadesinden işlev çıkarımı
- Tez No: 441756
- Danışmanlar: YRD. DOÇ. DR. AYBAR CAN ACAR
- Tez Türü: Doktora
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Bilim ve Teknoloji, Biyoistatistik, Computer Engineering and Computer Science and Control, Science and Technology, Biostatistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2016
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Enformatik Enstitüsü
- Ana Bilim Dalı: Tıp Bilişimi Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 97
Özet
Bu çalışmanın temel amacı,“İfade verisi kullanarak bir örneğin (doku/durum vb.) biyolojik bağlamını belirleyebilir miyiz ve bu bağlamları Gene Ontology, KEGG, HUGEgibi yorumlama veritabanları ile ilişkilendirebilir miyiz?”sorusuna cevap bulmamıza yardımcı olabilecek olasılıksal bir ikili kümeleme yaklaşımı geliştirmektir. Başlangıçta dökümanlarda bulunan bilinmeyen sayıdaki gizli temaları çıkartmak için geliştirilen ve metin madenciliği metodu olan olasılıksal tema modeli Hiyerarşik Dirichlet Süreci (HDP)'ni gen ifadesi veri analizine uyguladık. Bu çalışmada analoji mRNA transkriptten kelimeye, biyolojik bağlamdan temaya, örnekten dökümanadır. Bu tez çalışması, tema modellerini farklılaşmış ifade problemine belirli bir ölçüde uygulamayı başarmış çalışmaların üzerine inşa edilmiştir ve tema modellerinin gen ifadesi analizinde kullanılması için HDP'yi öncül bilgi ile güçlendirerek kapsamlı ve bütüncül bir metot geliştirilmiştir. Önerilen iyileştirmenin temel alanları, gen ifade verisinin tema modelleri için ön işlemesinin yapılması ve Hiyerarşik Dirichlet Sürecine bilgilendirilmiş öncüllerin eklenmesidir. Sonuçlar, öncül iyileştirilmiş HDP'nin gen ekspresyon verisi içindeki gizli ikili kümeleri seyreklik seviyesi (örnek sayısı) ve öncül gücündeki (η) değişikliklerden etkilenmeden başarılı bir şekilde ortaya çıkardığını göstermiştir.
Özet (Çeviri)
The main aim of this study is to develop a probabilistic biclustering approach which can help to elaborate on the question“Can we determine the biological context of a sample (tissue/condition etc.) using expression data and associate the contexts with annotation databases like Gene Ontology, KEGG and HUGE to discover annotations (like cell division, metabolic process, illness etc.) for these contexts?”. We applied a nonparametric probabilistic topic model, Hierarchical Dirichlet Process (HDP), which was originally developed for text mining to extract unknown number of latent topics from documents, to gene expression data analysis. In this study, the analogy is the mRNA transcript to the word, the biological context to the topic and the sample to the document. This study builds on previous studies that have, to varying extents, been able to apply topic models to the problem of differential expression, and improves on the current state of the art by producing a comprehensive and integrative method to enhance HDP with prior information. The main areas of proposed improvement are the preprocessing of gene expression data for topic models and the introduction of informed priors to the HDP model. The results of experiments showed that prior improved HDP successfully reveals the hidden biclusters in gene expression data with higher robustness to changes in sparsity levels (number of samples) and prior strengths (η).
Benzer Tezler
- Network-based analysis of cognitive impairment and memory deficits from transcriptome data
Transkriptom verileri kullanılarak hafıza problemlerinin ve bilişsel bozuklukların hücresel ağlara dayalı analizi
ELİF EMANETCİ
Yüksek Lisans
İngilizce
2019
BiyoistatistikGebze Teknik ÜniversitesiBiyomühendislik Ana Bilim Dalı
DOÇ. DR. TUNAHAN ÇAKIR
- İki katmanlı entegrasyon mimarisiyle hastalığa özel birliktelik ağı çıkarımı
Two tier combinatorial structure to infer disease specific coexpression network
MUSTAFA ÖZGÜR CİNGİZ
Doktora
Türkçe
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. BANU DİRİ
- Gen ifadesi verilerine çok kriterli karar verme yöntemlerinin uygulanması
Application of multiple criteria decision making methods to gene expression data
MERYEM GÜLŞAH PAMUK
Yüksek Lisans
Türkçe
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ İSMAİL ATACAK
- Metabolism-oriented multiomics data integration
Farklı omı̇k verı̇lerı̇n metabolı̇zma odaklı entegrasyonu
AYCAN ŞAHİN
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. ALİ ÇAKMAK
- Machine-learning approaches for neurological disorder diagnosis from genomic and neuroimaging data
Genomik ve nörogörüntüleme verilerinden nörolojik bozukluk teşhisi için makine öğrenmesi yaklaşımları
İSMAİL BİLGEN
Doktora
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. BEHÇET UĞUR TÖREYİN