Geri Dön

Gene function inference from expression using probabilistic topic models

Olasılıksal tema modelleri kullanarak gen ifadesinden işlev çıkarımı

  1. Tez No: 441756
  2. Yazar: BAHAR TERCAN
  3. Danışmanlar: YRD. DOÇ. DR. AYBAR CAN ACAR
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Bilim ve Teknoloji, Biyoistatistik, Computer Engineering and Computer Science and Control, Science and Technology, Biostatistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2016
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Enformatik Enstitüsü
  11. Ana Bilim Dalı: Tıp Bilişimi Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 97

Özet

Bu çalışmanın temel amacı,“İfade verisi kullanarak bir örneğin (doku/durum vb.) biyolojik bağlamını belirleyebilir miyiz ve bu bağlamları Gene Ontology, KEGG, HUGEgibi yorumlama veritabanları ile ilişkilendirebilir miyiz?”sorusuna cevap bulmamıza yardımcı olabilecek olasılıksal bir ikili kümeleme yaklaşımı geliştirmektir. Başlangıçta dökümanlarda bulunan bilinmeyen sayıdaki gizli temaları çıkartmak için geliştirilen ve metin madenciliği metodu olan olasılıksal tema modeli Hiyerarşik Dirichlet Süreci (HDP)'ni gen ifadesi veri analizine uyguladık. Bu çalışmada analoji mRNA transkriptten kelimeye, biyolojik bağlamdan temaya, örnekten dökümanadır. Bu tez çalışması, tema modellerini farklılaşmış ifade problemine belirli bir ölçüde uygulamayı başarmış çalışmaların üzerine inşa edilmiştir ve tema modellerinin gen ifadesi analizinde kullanılması için HDP'yi öncül bilgi ile güçlendirerek kapsamlı ve bütüncül bir metot geliştirilmiştir. Önerilen iyileştirmenin temel alanları, gen ifade verisinin tema modelleri için ön işlemesinin yapılması ve Hiyerarşik Dirichlet Sürecine bilgilendirilmiş öncüllerin eklenmesidir. Sonuçlar, öncül iyileştirilmiş HDP'nin gen ekspresyon verisi içindeki gizli ikili kümeleri seyreklik seviyesi (örnek sayısı) ve öncül gücündeki (η) değişikliklerden etkilenmeden başarılı bir şekilde ortaya çıkardığını göstermiştir.

Özet (Çeviri)

The main aim of this study is to develop a probabilistic biclustering approach which can help to elaborate on the question“Can we determine the biological context of a sample (tissue/condition etc.) using expression data and associate the contexts with annotation databases like Gene Ontology, KEGG and HUGE to discover annotations (like cell division, metabolic process, illness etc.) for these contexts?”. We applied a nonparametric probabilistic topic model, Hierarchical Dirichlet Process (HDP), which was originally developed for text mining to extract unknown number of latent topics from documents, to gene expression data analysis. In this study, the analogy is the mRNA transcript to the word, the biological context to the topic and the sample to the document. This study builds on previous studies that have, to varying extents, been able to apply topic models to the problem of differential expression, and improves on the current state of the art by producing a comprehensive and integrative method to enhance HDP with prior information. The main areas of proposed improvement are the preprocessing of gene expression data for topic models and the introduction of informed priors to the HDP model. The results of experiments showed that prior improved HDP successfully reveals the hidden biclusters in gene expression data with higher robustness to changes in sparsity levels (number of samples) and prior strengths (η).

Benzer Tezler

  1. Network-based analysis of cognitive impairment and memory deficits from transcriptome data

    Transkriptom verileri kullanılarak hafıza problemlerinin ve bilişsel bozuklukların hücresel ağlara dayalı analizi

    ELİF EMANETCİ

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    BiyoistatistikGebze Teknik Üniversitesi

    Biyomühendislik Ana Bilim Dalı

    DOÇ. DR. TUNAHAN ÇAKIR

  2. İki katmanlı entegrasyon mimarisiyle hastalığa özel birliktelik ağı çıkarımı

    Two tier combinatorial structure to infer disease specific coexpression network

    MUSTAFA ÖZGÜR CİNGİZ

    Doktora

    Türkçe

    Türkçe

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. BANU DİRİ

  3. Gen ifadesi verilerine çok kriterli karar verme yöntemlerinin uygulanması

    Application of multiple criteria decision making methods to gene expression data

    MERYEM GÜLŞAH PAMUK

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ İSMAİL ATACAK

  4. Metabolism-oriented multiomics data integration

    Farklı omı̇k verı̇lerı̇n metabolı̇zma odaklı entegrasyonu

    AYCAN ŞAHİN

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. ALİ ÇAKMAK

  5. Machine-learning approaches for neurological disorder diagnosis from genomic and neuroimaging data

    Genomik ve nörogörüntüleme verilerinden nörolojik bozukluk teşhisi için makine öğrenmesi yaklaşımları

    İSMAİL BİLGEN

    Doktora

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. BEHÇET UĞUR TÖREYİN