Geri Dön

Optimization models to identify key RNA regulatory modules in cancer

Kanserde anahtar RNA düzenleme modüllerini tanımlamak için optimizasyon modelleri

  1. Tez No: 668048
  2. Yazar: MILAD MOKHTARIDOOST
  3. Danışmanlar: DOÇ. DR. MEHMET GÖNEN
  4. Tez Türü: Doktora
  5. Konular: Biyoistatistik, Biostatistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2021
  8. Dil: İngilizce
  9. Üniversite: Koç Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Endüstri Mühendisliği ve Operasyon Yönetimi
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 116

Özet

MikroRNA'lar (miRNA), gen susturmanın ve transkripsiyon sonrası gen regülasyonunun önemli bir bileşeni olarak bilinir ve degradasyon veya translasyonel baskılama yoluyla haberci RNA'lar (mRNA) ile etkileşime girer. miRNA değişiklikleri, insan kanserlerinin oluşumu ve gidişatı üzerinde önemli bir etkiye sahiptir. Ek olarak, tümörlerin birincil dokusunu bulmak etkili ve tam bir tedavinin temel özelliklerinden biridir. Bu nedenle, hem dokuya özgü hem de hastalığa özgü miRNA-mRNA düzenleyici modüllerini belirleme becerisine sahip hesaplama yöntemlerinin kullanılması, hızla kanser biyolojisinde vazgeçilmez bir araç konumuna gelmiştir. Bu tezde ilk olarak, 9.000'den fazla birincil tümörün eşleştirilmiş miRNA ve mRNA ekspresyon profilleri üzerinde seyrek çok değiş kenli faktör regresyonu ile (SÇDFR) 32 kanser türünün düzenleyici modüllerini belirledik. Katsayı matrisini, her birinde seyreklik oluş turan ayrı ceza terimleri bulunan iki düşük ranklı matrise ayrıştıran bir algoritma kullandık. Çözümümüz normalize kare kök ortalama hata karesi açısından başka bir ayrıştırma tabanlı yaklaşımdan önemli ölçüde daha iyi performans göstermesine rağmen, çözümlerin seyreklik seviyesinin düşük olması nedeniyle algoritmanın yorumlanabilirliği tatmin edici değildi. Bu nedenle, miRNA-mRNA ilişkilerini modellemek ve miRNA ile mRNA arasındaki kansere özgü modülleri eşleşen ekspresyon profillerinden tanımlamak için tek görevli, iki aşamalı bir çerçeve sunduk. Ilk olarak, miRNA ve mRNA ekspresyon profilleri arasındaki düzenleyici matrisin kestirimini çoklu doğrusal programlama problemlerini çözerek yaptık. Daha sonra, etkili modül sayısını (yani, gizli faktörler) eşzamanlı olarak tahmin eden ve düzenleyici matrisi iki düşük ranklı matrise ayrıştırarak modülleri çıkaran bir birleşik regülarize faktör regresyon (BRFR) modeli formüle ettik. Bizim BRFR model gruplarımız miRNA'ları ve mRNA'ları kendi aralarında birbiriyle ilişkilendirdi ve her iki matrisin seyreklik seviyelerini kontrol etti ve bu da, yüksek kestirim performansı ile yorumlanabilir sonuçlara olanak sağladı. Yaklaşımımızın biyolojik anlamını bulmak için, fonksiyonel gen seti zenginleştirme ve hayatta kalma analizleri yaptık. Tanımlanan modüllerin büyük bir kısmı, Hallmark, PID ve KEGG yolak/gen setlerinde önemli ölçüde zenginleştirilmişti. Tanımlanan modülleri doğrulamak için, deneysel olarak desteklenen miRTarBase veritabanını ve literatür kaynaklarını kullandık. Önerilen tek görev algoritmasını 32 bağımsız kanser kohortuna uygulayarak, ilginç bir şekilde, tanımlanmış miRNA'larda ve mRNA'larda ve ayrıca belirli kohortlarla ilişkili belirli gen setlerinin öneminde benzer örüntüler gözlemledik. Önceki sonuçlardan esinlenerek, modelin tahmin performansını iyileştirmek, daha ayrıntılı ve bilgilendirici çözümler çıkarmak için aynı dokudaki farklı kanser kohortlarında miRNA-mRNA düzenleyici modüllerin mekanizmaları arasındaki benzerlikleri araştırmaya çalıştık. Dahası, aynı dokudaki kohortların ortak yönlerini tespit etmek, altta yatan doku ve hastalık mekanizmaları hakkında değerli bilgiler sağlayabilir. Bu nedenle, önemli doku ve hastalığa özgü miRNA-mRNA düzenleyici modüllerini, tümörlerin eşleşen ekspresyon profillerinden tanımlamak için çok görevli bir öğrenme formülasyonu oluşturduk. Bu amaçla, miRNA'lar ve mRNA'lar arasındaki seyrek ilişkiyi modellemek, dokuya ve hastalığa özgü miRNA-mRNA düzenleyici modüllerini ayrı ayrı çıkarmak ve hastalığa özgü düzenleyici sayılarını ve paylaşılan düzenleyici modül (yani, dokuya özgü düzenleyici modül) sayılarını tahmin etmek için çok görevli öğrenme ile seyrek düzenlenmiş faktör regresyonu (ÇGÖSDFR) yöntemini önerdik. Doğrulama sürecinde ilk basamak olarak, hastalığa özgü tanımlanmış miRNA'lar ile bunlara karşılık gelen kanser arasındaki ilişkiyi bulmak için literatür taraması yaptık. Daha sonra miRTarBase veri tabanını kullanarak miRNA-mRNA etkileşimlerinin deneysel olarak desteklenmiş doğrulamasını uyguladık. Son olarak, doku ve hastalığa özgü düzenleyici modüllerin ayırt edilmesinde ÇGÖSDFR modelinin performansını doğrulamak için, PID ve Hallmark koleksiyonlarındaki zenginleştirilmiş yolakları kontrol ederek, belirlenen anahtar düzenleyici modüllerin biyolojik mekanizmasını araştırdık. Genel sonuç, önerilen modelin anlamlı miRNA-mRNA düzenleyici modülleri etkili bir şekilde çıkarabildiğini ve doku ve hastalığa özgü modülleri başarıyla ayırt edebildiğini gösterdi.

Özet (Çeviri)

Micro RNAs (miRNAs) are known as the important components of RNA silencing and post-transcriptional gene regulation, and they interact with messenger RNAs (mRNAs) either by degradation or by translational repression. miRNA alterations have a significant impact on the formation and progression of human cancers. Additionally, finding primary tissue of tumors is a fundamental property of a precise treatment. Therefore, employing computational methods with the ability to identify both tissue-specific and cohort-specific miRNA-mRNA regulatory modules is fast becoming a crucial tool in cancer biology. In this thesis, we first identified regulatory modules of 32 cancer types using a sparse multivariate factor regression (SMFR) model on matched miRNA and mRNA expression profiles of more than 9,000 primary tumors. We used an algorithm that decomposes the coefficient matrix into two low-rank matrices with separate sparsity-inducing penalty terms on each. Although, our solution significantly outperformed another decomposition-based approach in terms of normalized root mean squared error, the interpretability of the algorithm was not satisfying, due to the low sparsity level of solutions. Therefore, we proposed a single task two-step framework to model miRNA-mRNA relationships and identify cancer-specific modules between miRNA and mRNA from their matched expression profiles. We first estimated the regulatory matrix between miRNA and mRNA expression profiles by solving multiple linear programming problems. We then formulated a unified regularized factor regression (RFR) model that simultaneously estimates the effective number of modules (i.e., latent factors) and extracts modules by decomposing regulatory matrix into two low-rank matrices. Our RFR model groups correlated miRNAs together and correlated mRNAs together, and controls sparsity levels of both matrices. These attributes lead to interpretable results with high predictive performance. To find the biological relevance of our approach, we performed functional gene set enrichment and survival analyses. A large portion of the identified modules are significantly enriched in Hallmark, PID and KEGG pathways/gene sets. To validate the identified modules, we also performed literature validation as well as validation using experimentally supported miRTarBase database. By applying proposed single-task algorithm on 32 independent cancer cohorts, interestingly we observed similar patterns in identified miRNAs and mRNAs, also in significance of certain gene sets for specific cohorts. Inspired with the previous results, we attempted to investigate the similarities between mechanism of miRNA-mRNA regulatory modules in different cancer cohorts from the same tissue to improve the predictive performance of the model and extract more detailed and informative solutions. Moreover, detecting commonalities of cohorts from the same tissue, can provide valuable information about the underlying tissue and cohort mechanisms. Hence, we established a multitask learning formulation to identify key tissue- and cohort-specific miRNA-mRNA regulatory modules from their matched expression profiles of tumors. To this end, we proposed a multitask learning sparse regularized factor regression (MSRFR) method to model the sparse relationship between miRNAs and mRNAs, extract tissue- and cohort-specific miRNA-mRNA regulatory modules separately and estimate the number of cohort-specific regulatory modules and shared modules (i.e., tissue-specific regulatory modules). As the validation process, we first performed literature survey to find the relationship of identified cohort-specific miRNAs and their corresponding cancer. We then applied experimentally supported validation of miRNA-mRNA interactions using miRTarBase database. Finally, to validate the performance of MSRFR model in distinguishing tissue- and cohort-specific regulatory modules, we explored the biological mechanism of identified key regulatory modules by checking their enriched pathways in PID and Hallmark collections. The overall result indicated that proposed model was able to effectively extract meaningful miRNA-mRNA regulatory modules and differentiate tissue- and cohort-specific modules.

Benzer Tezler

  1. Optimization models for survival analysis to identify key gene sets in cancer

    Kanser hastalığında önemli gen kümelerini belirlemek için geliştirilen en iyileme modelleri

    ONUR DERELİ

    Doktora

    İngilizce

    İngilizce

    2020

    Endüstri ve Endüstri MühendisliğiKoç Üniversitesi

    Endüstri Mühendisliği ve Operasyon Yönetimi

    PROF. DR. CEYDA OĞUZ

  2. Comprehensive risk mapping and fire station optimization for forest fire management: An application in Antalya

    Orman yangını yönetimi için kapsamlı risk haritalama ve yangın istasyonu optimizasyonu: Antalya uygulaması

    ZÜHAL ÖZCAN YAVUZ

    Doktora

    İngilizce

    İngilizce

    2024

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    PROF. DR. ÖZGÜR KABAK

    DR. ÖĞR. ÜYESİ İNCİ ÇAĞLAYAN

  3. State-space identification of switched linear systems via sparse optimization

    Anahtarlamalı doğrusal sistemlerin seyreklik optimizasyonu ile durum-uzay tanılaması

    FETHI BENCHERKI

    Yüksek Lisans

    İngilizce

    İngilizce

    2020

    Elektrik ve Elektronik MühendisliğiAnadolu Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ SEMİHA TÜRKAY

  4. Deformation behavior of thin walled structures filled with auxetic and non-auxetic core materials

    Ökzetik ve ökzetik olmayan dolgu malzemeli ince cidarlı yapıların deformasyon davranışı

    FATİH USTA

    Doktora

    İngilizce

    İngilizce

    2021

    Uçak Mühendisliğiİstanbul Teknik Üniversitesi

    Uçak ve Uzay Mühendisliği Ana Bilim Dalı

    PROF. DR. HALİT SÜLEYMAN TÜRKMEN

    PROF. DR. FABRIZIO SCARPA

  5. Isı değiştiricilerinde kullanılan manifoldlarda akışın analitik ve hesaplamalı akışkanlar dinamiği ile modellenmesi

    Analytical and computational fluid dynamics modelling of flow in heat exchanger manifold

    FATİH KANTAŞ

    Yüksek Lisans

    Türkçe

    Türkçe

    2012

    Makine Mühendisliğiİstanbul Teknik Üniversitesi

    Makine Mühendisliği Ana Bilim Dalı

    PROF. DR. SEYHAN UYGUR ONBAŞIOĞLU