Geri Dön

Gen ifadesi verilerinden derin öğrenme yaklaşımıyla genler arası dolaylı etkileşimlerin ortaya çıkarılması

Discovery of indirect interactions between genes by deep learning using gene expression data

  1. Tez No: 720778
  2. Yazar: GÜLCE ÇELEN
  3. Danışmanlar: DOÇ. DR. ALPER YILMAZ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Biyomühendislik, Bioengineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: Türkçe
  9. Üniversite: Yıldız Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Biyomühendislik Ana Bilim Dalı
  12. Bilim Dalı: Biyomühendislik Bilim Dalı
  13. Sayfa Sayısı: 61

Özet

Gen düzenleyici ağlar, transkripsiyon faktörleri ve bunların hedef genler arasındaki karmaşık düzenleyici ilişkileri açığa çıkarmak için kullanılan çizge tabanlı matematiksel modellerdir. Gen çiftlerinin sayısı düşünüldüğünde her bir transkripsiyon faktörü-hedef çifti için deneysel olarak gen düzenleyici ağların belirlenmesi mümkün değildir. Bu nedenle, farklı türde biyolojik verilerden gen düzenleyici ağların oluşturulması için birçok hesaplamalı yaklaşım geliştirilmiştir. Ancak gen ifadesi verilerinden düzenleyici ağların daha doğru olarak ortaya çıkarılması hesaplamalı biyolojide hala zorlu bir iştir. Derin öğrenme yöntemlerinin bir sınıfı olan evrişimli sinir ağı, gen ifadesi verisinden transkripsiyon faktörü-hedef çifti tahmininde kullanılabilmektedir. Bu çalışmada benzer bir yaklaşım, normal örneklerden ve tümör örneklerinden insan transkripsiyon faktörü-hedef çiftlerinin tahmin edilmesi amacıyla insan RNA-Seq verisi üzerinde uygulanmıştır. İnsan transkripsiyon faktörü-hedef etkileşimleri TRRUST veri tabanından ve RNA-Seq verisi ise TCGA ve GTEx projelerinden sırasıyla insan tümör örnekleri ile insan normal örneklerini içeren UCSC Toil'den alınmıştır. %80 eğitim verisi, %10 validasyon verisi ve %10 test verisi olarak oluşturulması amacıyla her transkripsiyon faktörü-hedef çifti için gen ifadesi değerleri çıkartılmıştır. Normal örnekler ve tümör örnekleri için iki farklı model oluşturulmuştur. Sonuç olarak normal örneklerde ve tümör örneklerinde transkripsiyon faktörü-hedef çiftlerinin tahmini için iki ayrı evrişimli sinir ağı modeli geliştirilmiştir. Tümör örnekleriyle eğitilen CNN modeli %92 validasyon doğruluğu gösterirken normal örneklerle eğitilen diğer CNN modeli %91 validasyon doğruluğu göstermiştir. Yaklaşımımız var olan ve artmaya devam eden insan gen düzenleyici ağlarının genişlemeye devam etmesi için bir potansiyele sahiptir. Aynı zamanda, normal örnekler ve tümör örnekleri için ayrı transkripsiyon faktörü-hedef tahminleri, tümör mekanizmalarında bir role sahip olan transkripsiyon faktörü-hedef etkileşimlerini ortaya çıkarabilir.

Özet (Çeviri)

Gene regulatory networks are graph based mathematical models to elucidate complex regulatory relationships between transcription factors and their target genes. Considering the number of gene pairs, identifying gene regulatory networks for every transcription factor-target pair experimentally is infeasible. Therefore, many computational approaches have been developed to reconstruct gene regulatory networks from different types of biological data. However, uncovering regulatory interactions from gene expression data more accurately is still a challenge in computational biology. Convolution neural network which is a class of deep learning methods can be used to predict transcription factor-target pairs from gene expression data. In this study a similar approach is applied to human RNA-Seq data to predict human transcription factor-target pairs from normal samples and tumor samples. Human transcription factor-target interactions were retrieved from TRRUST database and human RNA-Seq data for tumor and normal samples were retrieved from UCSC Toil which contains data from TCGA and GTEx projects, respectively. For each transcription factor-target pair, expression values were extracted to assemble data as 80% for training, 10% for validation and 10% for test data. Two separate models were generated for normal and tumor samples. As a result, two separate convolutional neural network models were developed to predict transcription factor-target pairs in normal and tumor samples. CNN model which is trained on tumor samples demonstrated 92% validation accuracy, while the other CNN model which is trained on normal samples demonstrated 91% validation accuracy. Our approach has potential to extend the existing and ever growing human gene regulatory networks. Also, individual transcription factor-target predictions for normal and tumor samples may reveal transcription factor-target interactions which has role in tumor mechanisms.

Benzer Tezler

  1. Deepside: Predicting drug side effects with deep learning

    Deepsıde: İlaçların ters ve yan etkilerini tahmin etmek için derin öğrenme

    ONUR CAN ÜNER

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ABDULLAH ERCÜMENT ÇİÇEK

    DR. ÖĞR. ÜYESİ ÖZNUR TAŞTAN OKAN

  2. Machine-learning approaches for neurological disorder diagnosis from genomic and neuroimaging data

    Genomik ve nörogörüntüleme verilerinden nörolojik bozukluk teşhisi için makine öğrenmesi yaklaşımları

    İSMAİL BİLGEN

    Doktora

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. BEHÇET UĞUR TÖREYİN

  3. A comparative study of deep learning methods for classification of rna-seq cancer data

    Rna-seq kanser verilerinin sınıflandırılması için derin öğrenme yöntemlerinin karşılaştırmalı bir çalışması

    NİHAT YILMAZ ŞİMŞEK

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHasan Kalyoncu Üniversitesi

    Elektronik-Bilgisayar Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ BÜLENT HAZNEDAR

  4. Gen ifadesi verilerine çok kriterli karar verme yöntemlerinin uygulanması

    Application of multiple criteria decision making methods to gene expression data

    MERYEM GÜLŞAH PAMUK

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ İSMAİL ATACAK

  5. Yeni nesil RNA sekanslama ve mikrodizin verilerinin analizi ile kanserde transkriptomik bilgilerin eldesi

    Transcriptomic data retrieval from cancer using next generation RNA sequencing and microarray data analyses

    EBUBEKİR AYHAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2020

    BiyolojiZonguldak Bülent Ecevit Üniversitesi

    Moleküler Biyoloji Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ KEREM MERT ŞENSES