Geri Dön

Gen ağı çıkarımı için proteomik ve gen ifade verilerinin entegrasyonunda ilişki tahmincilerin etkisi

The association estimators' effect on the integration of proteomic and gene expression data for gene network inference

  1. Tez No: 507343
  2. Yazar: CİHAT ERDOĞAN
  3. Danışmanlar: PROF. DR. BANU DİRİ
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Biyoistatistik, Computer Engineering and Computer Science and Control, Biostatistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2018
  8. Dil: Türkçe
  9. Üniversite: Yıldız Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 129

Özet

Bu tez çalışmasında gen ağı çıkarım yöntemleri üzerinde önemli etkiye sahip olan ve moleküler etkileşimleri belirlemek için kullanılan ilişki tahmincilerinin, farklı biyolojik veri türlerinin entegrasyonu üzerindeki etkisi incelenmiştir. Tezde incelenen tüm kanser türleri için gen ifade ve proteomik verileri The Cancer Proteome Atlas (TCPA) tarafından sağlanmıştır. Öncelikle korelasyon tabanlı ilişki tahmincilerin etkisi, literatürde sıklıkla kullanılan Gen Ağı Çıkarım (GAÇ) yöntemleri kullanılarak, on altı farklı kanser türüne ait proteomik veriler analiz edilerek incelenmiştir. Ardından, Amerikan Kanser Topluluğu verilerine göre yaygın olarak görülen beş farklı kanser türüne ait proteomik verileri kullanılarak, hastalıkla ilişkili gen-gen/protein-protein etkileşim alt ağlarındaki merkez genler/proteinler tespit edilmeye çalışılmıştır. Bu işlem sırasında literatürde sıklıkla kullanılan karşılıklı bilgi (KB) ve korelasyon tabanlı dokuz ilişki kestirimci karşılaştırılmıştır. İlişki tahmincilerinin performansını ölçmek için altın standart olarak, Hastalık-Gen ilişkileri entegrasyon platformu (DisGeNET) ve Moleküler İmzalar Veritabanı (MSigDB) kullanılmıştır. Oluşturulan ortak ifade ağları ile hastalıkla ilişkili yollar karşılaştırılmış ve ilişki tahmincilerinin performansını değerlendirmek için Fisher'ın kesinlik testi kullanılmıştır. Ağırlıklı korelasyon ağ analizinde (WGCNA) düzenleyici ağların tahmini için kullanılan Spearman ve Pearson korelasyon yaklaşımlarına göre, KB tabanlı ilişki tahmincilerinin başarımının daha yüksek olduğu gözlenmiştir. Korelasyon tabanlı yöntemlerde beş kanser türü için en iyi ortalama başarı oranı %60 iken, KB tabanlı yöntemlerde ortalama başarı oranı James-Stein Shrinkage (Shrink) için %71, Schurmann-Grassberger (SG) için %64'tür. Sonrasında gen ifade ve proteomik verilerinden çıkarımlanmış ağların entegrasyonu sağlanmıştır. Son olarak her bir kanser türüne göre merkez genler ve çıkarımlanmış alt ağlar, araştırmacıların ve biyologların incelemesi için sunulmuştur.

Özet (Çeviri)

In this thesis, the effects of association estimators, which have a significant influence on gene network inference methods and used to determine molecular interactions, on the integration of different biological data types were examined. Gene expression and proteomic data for all cancer types used in this thesis were provided from The Cancer Proteome Atlas (TCPA). Firstly, the effect of the correlation-based association estimators on the analysis of proteomic data from sixteen different cancer types was examined by using Gene Network Inference (GAI) methods that are frequently used in the literature. Furthermore, attempts were made to detect the hub genes/proteins in the gene-gene/protein-protein interaction subnetworks associated with the disease by using proteomic data from five different cancer types, which are commonly seen according to American Cancer Society data. During this process, the mutual information (MI) and correlation based nine association estimators, which are commonly used in the literature, were compared. The disease-gene association integration platform (DisGeNET) and the Molecular Signature Database (MSigDB) were used as the gold standard for measuring the performance of the association estimators. The disease-associated pathways were compared with the as-generated co-expression networks and the Fisher's exact test was used to assess the association estimators' performance. Based on the Spearman and Pearson correlation approaches used for the estimation of regulatory networks in the weighted correlation network analysis (WGCNA), the MI-based association estimators' performance was observed to be higher. The best average success rate for five cancer types is 60% for the correlation-based methods, while for the MI-based methods it is 71% for James-Stein Shrinkage (Shrink), and 64% for Schurmann-Grassberger (SG). Integration of the inferred networks was then conducted by using the gene expression and proteomic data. Finally, for each cancer type, hub genes and inferred subnets are presented for the investigations of researchers and biologists.

Benzer Tezler

  1. Gen ağı çıkarım algoritmaları için en uygun ilişki kestirimcilerinin belirlenmesi

    Determining the most suitable correlation estimators for gene network inference algorithms

    ZEYNEB KURT

    Doktora

    Türkçe

    Türkçe

    2013

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. NİZAMETTİN AYDIN

    DOÇ. DR. GÖKMEN ALTAY

  2. Machine-learning approaches for neurological disorder diagnosis from genomic and neuroimaging data

    Genomik ve nörogörüntüleme verilerinden nörolojik bozukluk teşhisi için makine öğrenmesi yaklaşımları

    İSMAİL BİLGEN

    Doktora

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. BEHÇET UĞUR TÖREYİN

  3. C3net algorithm using dynamic bayesian network

    Dinamik bayes ağları kullanarak C3net algoritması

    MOHAMMED ABDULGHANI TAHA

  4. İki katmanlı entegrasyon mimarisiyle hastalığa özel birliktelik ağı çıkarımı

    Two tier combinatorial structure to infer disease specific coexpression network

    MUSTAFA ÖZGÜR CİNGİZ

    Doktora

    Türkçe

    Türkçe

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. BANU DİRİ

  5. Inference of differential gene networks

    Farksal gen ağları çıkarımı

    ONUR MENDİ

    Doktora

    İngilizce

    İngilizce

    2016

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBahçeşehir Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. ADEM KARAHOCA