Geri Dön

Yüksek ölçekli genomik verinin çok yönlü analizi

Multiway analysis of high throughput genomic data

  1. Tez No: 337844
  2. Yazar: DUYGU DEDE
  3. Danışmanlar: DOÇ. DR. HASAN OĞUL
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2013
  8. Dil: Türkçe
  9. Üniversite: Başkent Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 88

Özet

Gelişen mikroçip teknolojileri sayesinde gen ifade (gene expression) verilerinin ölçümleri yapılarak yüksek ölçekli (high throughput) veriler elde edilebilmekte ve bu veriler çok boyutlu matrislerde saklanabilmektedir. Yüksek ölçekli verinin analizi, gerek işlemsel karmaşıklık yönüyle, gerekse anlamlı bilgi çıkarımındaki zorluklar nedeniyle üzerinde çalışılması gereken önemli bir konudur. Son yıllarda özellikle yaşam bilimleri alanında bu tür veri üretiminin fazla olması ve genellikle bu verilerin analizlerinin gözle veya standart yöntemlerle yapılamaması nedeniyle, problem daha kritik bir hale gelmiştir. Bu tür veriler, yapılan deneyler ve kullanılan düzenekler gereği, çok yönlü ve/veya çok kaynaklı bir yapıya sahip olabilmektedir. Bu çalışmada belirtilen motivasyondan yola çıkılarak, akıllı veri analizi yeterliliklerini artıracak bir yöntemin geliştirilmesi hedeflenmiş ve bir yazılım aracının gerçekleştirimi yapılmıştır. Geliştirilen uygulamada iki veya daha fazla organizmadan (örneğin; insan, fare ve maymun) alınan, aynı koşullarda elde edilmiş mRNA (mesajcı RNA) ifade verileriyle türler arası (çok kaynaklı) bir analiz hedeflenmiştir. Bunun için yeni bir üç-yönlü kümeleme yöntemi (TriClustering) geliştirilmiş ve bu yöntem geliştirilen yazılım aracı ile NCBI'S GEO veri merkezinden alınan üç farklı veri kümesine uygulanmıştır. Gen ontoloji (GO) terimi zenginleşme analizi ve Dunn indeks (DI) metriği kullanılarak sonuçların biyolojik ve istatiksel değerlendirilmesi yapılmıştır. Deneysel sonuçlara göre TriClustering yöntemi anlamlı üçlü kümeler (tricluster) bulabilen, türler arası analiz için kullanışlı bir araçtır.

Özet (Çeviri)

High throughput data can be generated by developing techniques and represented in large matrices. Analysis of such data has become one of the major tool but it has brought along many challenges for biological data mining such as process complexities and difficulties in information retrieval. In recent years these challenges have become critic since huge amount of data is produced especially in life sciences and standard techniques may not be used in analysing of such data. This kind of data structure may be multi-way and/or multi-source by used test and devices. In this study based on the specified motivation, a novel method and software tool are developed to increase proficency of data analysis techniques. The developed method aims to make cross species (multi sources) analysis using mRNA expression values obtained from different organisms (human, mouse, monkey etc.) under same conditions. To achieve this goal a novel three way clustering method named TriClustering is introduced and the method has been applied to three different gene expression data obtained from NCBI?s GEO data collection. Biological and statistical significance of the results are evaluated using Gene Ontology (GO) term enrichment analysis and Dunn index (DI) metric, respectively. The experimental results indicate that TriClustering on multi-organism data can be resulted with better gene clusters in comparison to biclustering on single-organism data. The method also promote a useful tool for cross species gene regulation analysis.

Benzer Tezler

  1. Efficient machine learning models for cancer biology

    Kanser biyolojisi için etkin yapay öğrenme modelleri

    AYYÜCE BEGÜM BEKTAŞ

    Doktora

    İngilizce

    İngilizce

    2022

    Endüstri ve Endüstri MühendisliğiKoç Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DOÇ. DR. MEHMET GÖNEN

  2. Amyotrophic lateral sclerosis in Turkey: Studies on familial and Sporadic ALS using high-throughput genomic technologies

    Türkiye?de amiyotrofik lateral skleroz: Ailesel ve Sporadik ALS?de yüksek-ölçekli genomik yöntemlerin uygulanması

    ASLIHAN ÖZOĞUZ

    Doktora

    İngilizce

    İngilizce

    2010

    BiyolojiBoğaziçi Üniversitesi

    Moleküler Biyoloji ve Genetik Ana Bilim Dalı

    PROF. DR. A. NAZLI BAŞAK

  3. Enhancement and validation of current human genome annotation via novel proteogenomics algorithms

    Var olan insan genom anotasyonunun yeni proteogenomik yöntemler ile doğrulanması ve geliştirilmesi

    CANAN HAS

    Doktora

    İngilizce

    İngilizce

    2016

    Biyolojiİzmir Yüksek Teknoloji Enstitüsü

    Moleküler Biyoloji ve Genetik Ana Bilim Dalı

    DOÇ. DR. JENS ALLMER

  4. Comprehensive mapping of the genomic evolution in human fibroblasts reaching replicative senescence

    Replikatif yaşlanmaya ulaşan insan fibroblastlarında genomik evrimin kapsamlı haritanlanması

    ELİF DUYMAZ

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Biyomühendislikİzmir Ekonomi Üniversitesi

    Biyomühendislik Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ CİHANGİR YANDIM

  5. Kalıtsal retina dejenerasyonlarında DNA mikroarray yöntemiyle yüksek ölçekli genom taraması

    High-throughput genome screening by DNA microarray in inherited retinal degenerations

    DİDEM YÜCEL

    Doktora

    Türkçe

    Türkçe

    2010

    GenetikHacettepe Üniversitesi

    Biyoloji Ana Bilim Dalı

    DOÇ. DR. RIZA KÖKSAL ÖZGÜL

    PROF. DR. AY ÖĞÜŞ