Gen ifadesi verilerinden derin öğrenme yaklaşımıyla genler arası dolaylı etkileşimlerin ortaya çıkarılması
Discovery of indirect interactions between genes by deep learning using gene expression data
- Tez No: 720778
- Danışmanlar: DOÇ. DR. ALPER YILMAZ
- Tez Türü: Yüksek Lisans
- Konular: Biyomühendislik, Bioengineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: Türkçe
- Üniversite: Yıldız Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Biyomühendislik Ana Bilim Dalı
- Bilim Dalı: Biyomühendislik Bilim Dalı
- Sayfa Sayısı: 61
Özet
Gen düzenleyici ağlar, transkripsiyon faktörleri ve bunların hedef genler arasındaki karmaşık düzenleyici ilişkileri açığa çıkarmak için kullanılan çizge tabanlı matematiksel modellerdir. Gen çiftlerinin sayısı düşünüldüğünde her bir transkripsiyon faktörü-hedef çifti için deneysel olarak gen düzenleyici ağların belirlenmesi mümkün değildir. Bu nedenle, farklı türde biyolojik verilerden gen düzenleyici ağların oluşturulması için birçok hesaplamalı yaklaşım geliştirilmiştir. Ancak gen ifadesi verilerinden düzenleyici ağların daha doğru olarak ortaya çıkarılması hesaplamalı biyolojide hala zorlu bir iştir. Derin öğrenme yöntemlerinin bir sınıfı olan evrişimli sinir ağı, gen ifadesi verisinden transkripsiyon faktörü-hedef çifti tahmininde kullanılabilmektedir. Bu çalışmada benzer bir yaklaşım, normal örneklerden ve tümör örneklerinden insan transkripsiyon faktörü-hedef çiftlerinin tahmin edilmesi amacıyla insan RNA-Seq verisi üzerinde uygulanmıştır. İnsan transkripsiyon faktörü-hedef etkileşimleri TRRUST veri tabanından ve RNA-Seq verisi ise TCGA ve GTEx projelerinden sırasıyla insan tümör örnekleri ile insan normal örneklerini içeren UCSC Toil'den alınmıştır. %80 eğitim verisi, %10 validasyon verisi ve %10 test verisi olarak oluşturulması amacıyla her transkripsiyon faktörü-hedef çifti için gen ifadesi değerleri çıkartılmıştır. Normal örnekler ve tümör örnekleri için iki farklı model oluşturulmuştur. Sonuç olarak normal örneklerde ve tümör örneklerinde transkripsiyon faktörü-hedef çiftlerinin tahmini için iki ayrı evrişimli sinir ağı modeli geliştirilmiştir. Tümör örnekleriyle eğitilen CNN modeli %92 validasyon doğruluğu gösterirken normal örneklerle eğitilen diğer CNN modeli %91 validasyon doğruluğu göstermiştir. Yaklaşımımız var olan ve artmaya devam eden insan gen düzenleyici ağlarının genişlemeye devam etmesi için bir potansiyele sahiptir. Aynı zamanda, normal örnekler ve tümör örnekleri için ayrı transkripsiyon faktörü-hedef tahminleri, tümör mekanizmalarında bir role sahip olan transkripsiyon faktörü-hedef etkileşimlerini ortaya çıkarabilir.
Özet (Çeviri)
Gene regulatory networks are graph based mathematical models to elucidate complex regulatory relationships between transcription factors and their target genes. Considering the number of gene pairs, identifying gene regulatory networks for every transcription factor-target pair experimentally is infeasible. Therefore, many computational approaches have been developed to reconstruct gene regulatory networks from different types of biological data. However, uncovering regulatory interactions from gene expression data more accurately is still a challenge in computational biology. Convolution neural network which is a class of deep learning methods can be used to predict transcription factor-target pairs from gene expression data. In this study a similar approach is applied to human RNA-Seq data to predict human transcription factor-target pairs from normal samples and tumor samples. Human transcription factor-target interactions were retrieved from TRRUST database and human RNA-Seq data for tumor and normal samples were retrieved from UCSC Toil which contains data from TCGA and GTEx projects, respectively. For each transcription factor-target pair, expression values were extracted to assemble data as 80% for training, 10% for validation and 10% for test data. Two separate models were generated for normal and tumor samples. As a result, two separate convolutional neural network models were developed to predict transcription factor-target pairs in normal and tumor samples. CNN model which is trained on tumor samples demonstrated 92% validation accuracy, while the other CNN model which is trained on normal samples demonstrated 91% validation accuracy. Our approach has potential to extend the existing and ever growing human gene regulatory networks. Also, individual transcription factor-target predictions for normal and tumor samples may reveal transcription factor-target interactions which has role in tumor mechanisms.
Benzer Tezler
- Deepside: Predicting drug side effects with deep learning
Deepsıde: İlaçların ters ve yan etkilerini tahmin etmek için derin öğrenme
ONUR CAN ÜNER
Yüksek Lisans
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ABDULLAH ERCÜMENT ÇİÇEK
DR. ÖĞR. ÜYESİ ÖZNUR TAŞTAN OKAN
- Machine-learning approaches for neurological disorder diagnosis from genomic and neuroimaging data
Genomik ve nörogörüntüleme verilerinden nörolojik bozukluk teşhisi için makine öğrenmesi yaklaşımları
İSMAİL BİLGEN
Doktora
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. BEHÇET UĞUR TÖREYİN
- A comparative study of deep learning methods for classification of rna-seq cancer data
Rna-seq kanser verilerinin sınıflandırılması için derin öğrenme yöntemlerinin karşılaştırmalı bir çalışması
NİHAT YILMAZ ŞİMŞEK
Yüksek Lisans
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHasan Kalyoncu ÜniversitesiElektronik-Bilgisayar Ana Bilim Dalı
DR. ÖĞR. ÜYESİ BÜLENT HAZNEDAR
- Gen ifadesi verilerine çok kriterli karar verme yöntemlerinin uygulanması
Application of multiple criteria decision making methods to gene expression data
MERYEM GÜLŞAH PAMUK
Yüksek Lisans
Türkçe
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ İSMAİL ATACAK
- Yeni nesil RNA sekanslama ve mikrodizin verilerinin analizi ile kanserde transkriptomik bilgilerin eldesi
Transcriptomic data retrieval from cancer using next generation RNA sequencing and microarray data analyses
EBUBEKİR AYHAN
Yüksek Lisans
Türkçe
2020
BiyolojiZonguldak Bülent Ecevit ÜniversitesiMoleküler Biyoloji Ana Bilim Dalı
DR. ÖĞR. ÜYESİ KEREM MERT ŞENSES