Geri Dön

TCGAnalyzeR: A web portal for visualization of pan-cancer molecular patient data

TCGAnalyzeR: Pan-kanser moleküler hasta verilerinin görüntülenmesi için bir web portalı geliştirilmesi

  1. Tez No: 712477
  2. Yazar: BAŞAK ABAK
  3. Danışmanlar: DR. ÖĞR. ÜYESİ TUĞBA SÜZEK
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Biyoistatistik, Tıbbi Biyoloji, Computer Engineering and Computer Science and Control, Biostatistics, Medical Biology
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2021
  8. Dil: İngilizce
  9. Üniversite: Muğla Sıtkı Koçman Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Biyoinformatik Ana Bilim Dalı (Disiplinlerarası)
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 131

Özet

Kanser Genom Atlas (TCGA) veri tabanı (TCGA Network, 2013), en büyük ve en yaygın kullanılan kamu kaynaklarından biridir. 11.000 kanser hastasının çok boyutlu moleküler verilerini içerir. TCGA ve PubChem BioAssay veritabanlarından akciğer adenokarsinomu (LUAD), akciğer skuamöz hücreli karsinomu (LUSC), karaciğer hepatoselüler karsinom (LIHC) ve meme invaziv karsinomun (BRCA) hastalarının tek nükleotid varyasyonlarının (SNV'ler), kopya sayısı varyasyonlarının (CNV'ler), RNA sekansının ve klinik hasta verilerinin entegre bir meta-analizini gerçekleştirdik. Bu projede, kullanıcıların kanser tipi, veri kategorisi, mutasyon tipi, risk grubu ve kohort tipini seçmelerini sağlayan büyük verilerin bu 4 ana kategoride istatistiksel analizini sağlayan bir web platformu kurduk. 1)“SNV”analizi kategorisinde 5 tip analiz uygulanacaktır; Oncoplot grafiği, OncoPrint grafiği, Lolipop grafiği, Piramit grafiği ve Zenginleştirme grafikleri; Çubuk grafiği, Cnet grafiği, Isı grafiği ve Küme grafiği. 2)“CNV”analizi kategorisinde 3 tip çizim uygulamıştır; CNV grafiği, OncoPrint ve Zenginleştirme grafiği; Çubuk grafiği, Cnet grafiği, Isı grafiği ve Küme Grafiği. 3)“Transcriptome Profiling”analizi kategorisinde 4 tip çizim sağlanmıştır: Volkan Grafiği, Kutu grafiği ve Zenginleştirme grafiği; Çubuk grafiği, Cnet grafiği, Isı grafiği ve Küme Grafiği. 4)“Klinik”analiz kategorisinde, kullanıcının klinik verilerden seçeceği sütun adlarına göre dinamik olarak veri dağılım grafikleri ve sağkalım grafikleri çizilebilmekte ve grafiklerin yayın kalitesinde çıktısı alınabilmektedir. Her grafiğin filtreleme seçenekleri ve veri tabloları mevcut. Bu nedenle kullanıcı filtreleri uygulayarak grafiği yeniden çizebilir. Kullanıcılar ayrıca grafik ve ilgili tabloları indirebilir. Tablolarda verilen gen isimleri vurgulanarak, kullanıcının bir gen seçip“Genlerim”paneline eklemesi ve grafikleri filtrelemesi ve seçilen genleri panoya kopyalaması sağlanır. Moleküler veri kategorilerine ek olarak,“DrugFinder”sayfası, 1 mikromolardan daha az biyoaktiviteye sahip en çok sayıda PubChem deneyi içeren TCGA'da seçilen ilaçların en aktif protein hedef adını döndürür. Web platformunun prototipi, R programlama dili kullanılarak geliştirildi ve bir Linux Shiny sunucusuna kuruldu.

Özet (Çeviri)

The Cancer Genome Atlas (TCGA) database (TCGA Network, 2013) is one of the largest and most commonly used public resources. It contains multidimensional molecular data of 11,000 cancer patients. We carried out an integrated meta-analysis of the single-nucleotide variations (SNVs), the copy number variations (CNVs), RNA-seq and clinical data of lung adenocarcinoma (LUAD), lung squamous cell carcinoma (LUSC), liver hepatocellular carcinoma (LIHC) and breast invasive carcinoma (BRCA) patients from TCGA and PubChem BioAssay databases. In this project, we have deployed a web platform enabling statistical analysis of big data in 4 main categories providing the users to select the cancer type, data category, mutation type, risk group and cohort type. 1) In the category of“SNV”analysis, 5 types of plots was implemented; Oncoplot, OncoPrint, Lollipop Plot, Pyramid Plot and Enrichment Plots; Bar Plot, Cnet Plot, Heat Plot and Upset Plot. 2) In the category of“CNV”analysis, 3 types of plots was implemented; CNV Plot, OncoPrint and Enrichment Plots; Bar Plot, Cnet Plot, Heat Plot and Upset Plot. 3) In the category of“Transcriptome Profiling”analysis, 4 types of plots was provided: Volcano Plot, Box Plot and Enrichment Plots; Bar Plot, Cnet Plot, Heat Plot and Upset Plot. 4) In the category of“Clinical”analysis, data distribution plots and survival plots was drawn using the column names that the user dynamically choose from the clinical data. Each plot has its own filtration options and data tables. Therefore the user can redraw the plot by applying the filters. Users also can download the plot and related tables. The gene names given in the tables are highlighted to enable the user to select and add a gene to the“My genes”panel for filtering plots and copying the selected genes to the clipboard. In addition to the molecular data categories, the“DrugFinder”page returns the most active protein target name of the selected drugs in TCGA containing the most number of PubChem experiments with bioactivity less than 1 micromolar. The prototype of the web platform was developed using the R programming language and deployed on a Linux Shiny server.

Benzer Tezler