Farklı kanser türlerine ait rnaseq verilerinde intron tutulumunun tespiti ve sınıflandırılmasında biyoinformatik yaklaşımların değerlendirilmesi
Evaluation of bioinformatic approaches in detection and classification of intron retention in rnaseq data of different cancer types
- Tez No: 892058
- Danışmanlar: PROF. DR. GÖKMEN ZARARSIZ, DOÇ. DR. VAHAP ELDEM
- Tez Türü: Yüksek Lisans
- Konular: Biyoistatistik, Genetik, Biostatistics, Genetics
- Anahtar Kelimeler: IRFinder-S, İntron Tutulumu, Iread, Kanser, Whippet, Cancer, IRFinder-S, Intron Retention, Iread, Whippet
- Yıl: 2024
- Dil: Türkçe
- Üniversite: Erciyes Üniversitesi
- Enstitü: Sağlık Bilimleri Enstitüsü
- Ana Bilim Dalı: Biyoistatistik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 164
Özet
İntron tutulumunun çeşitli kanser oluşum yolakları ile ilişkili olduğu bildirilmiştir. Güvenilir bir şekilde ölçülmesi zor olduğu için genellikle ihmal edilen bir alternatif kırpılma sınıfını oluşturur. Bu çalışmada NCBI-SRA veritabanından Meme-Üçlü Negatif Meme Kanseri alt tipi (n:67), Servikal (n:12), Kolorektal (n:144), Mide (n:160), Akciğer (n:62), Prostat (n:60) kanser türlerine ait kontrol ve tümör RNA-seq verileri indirilerek intron tutulumunu belirlemek için bildirilen IRFinder, IRFinder-S, iREAD, Whippet algoritma sonuçlarının değerlendirilmesi ve iş akış yönergesinin oluşturulması amaçlanmıştır. Elde edilen sonuçlara göre IRFinder, IRFinder-S, İREAD algoritmalarının belirlediği gen bölgelerinin kesişim noktasında kontrol grubuna göre tümör grubunda yukarı yönlü intron tutulumu meme (47 gen bölgesi), kolorektal (3 gen bölgesi), akciğer (2 gen bölgesi), mide (17 gen bölgesi) kanserinde belirlenmiştir. Aşağı yönlü intron tutulumu ise meme (3 gen bölgesi), akciğer (5 gen bölgesi), prostat (3 gen bölgesi) kanseri verilerinde belirlenmiştir. Servikal kanser verilerinde intron tutulumu kesişimleri belirlenememiştir. Kesişim bölgelerine ait Cohen Kappa sonuçlarına göre en uyumlu algoritmaların IRFinder ve IRFinder-S (%99) olduğu belirlenmiştir. İREAD'in ilk iki algoritma ile ortak tutulan intron bölgelerini kromozom sayısı başlangıç ve bitiş bölgeleri olarak belirleyebildiği Whippet algoritmasının ise belirleyemediği gözlenmiştir. Üç algoritmada (IRFinder, IRFinder-S, İREAD) bulunan genlerin yolak analizi sonuçlarına göre özellikle meme kanserinde ENSG00000074181 (NOTCH3) ve kolorektal kanserde ENSG00000080824 (HSPA90AA1), akciğer kanserinde ENSG00000183020 (AP2A2) ilgili dokulara özgü kanser yolakları ile ilişkili olabileceği aynı zamanda prostat kanseri aşağı yönlü intron tutulumu genlerinden ENSG00000160789 (LMNA) geninin de bu yolaklarda intron tutulumu bakımından ilişkili olabileceği dolayısıyla incelenmesi önerilmiştir. Literatür taramaları ve araştırma sonucu elde edilen verilere göre IRFinder, IRFinder-S ve İREAD algoritmalarında ortak bulunan tutulmuş intron bölgelerinin dikkate alınarak, yolak analizlerinin yapılması, validasyon çalışmalarının yapılması gerektiği, hastalık patogenezinin belirlenmesine yönelik yeni ip uçlarının keşfedilebileceği ön görülmüştür.
Özet (Çeviri)
Intron retention has been reported to be associated with various carcinogenesis pathways. It constitutes a class of alternative splicing that is often neglected because it is difficult to measure reliably. In the present study, we analysed the NCBI-SRA database (publicly available, paired-end data) of Breast-Triple Negative Breast Cancer subtype (n:67), Cervical (n:12), Colorectal (n:144), Gastric (n:160), Lung (n:62), Prostate (n:60) cancer types control and tumor RNA-seq data were downloaded to evaluate the reported IRFinder, IRFinder-S, iREAD, Whippet algorithm results to determine intron involvement and to create workflow guidelines. According to the obtained results, upstream intron retention in the tumor group at the intersection of gene regions determined by IRFinder, IRFinder-S, and iREAD algorithms was determined in breast (47 gene regions), colorectal (3 gene regions), lung (2 gene regions), gastric (17 gene regions) cancer compared to the control group. In downstream intron retention was determined in breast (3 gene regions), lung (5 gene regions), and prostate (3 gene regions) cancer data. Intron intersections could not be determined in cervical cancer data. According to the Cohen Kappa results of the intersection regions, the most compatible algorithms were IRFinder and IRFinder-S (99%). It was observed that IRFinder was able to identify the intron regions shared by the first two algorithms as chromosome number start-end regions. In contrast, the Whippet algorithm was not able to identify them. According to the pathway analysis results of the genes found in the three algorithms (IRFinder, IRFinder-S, IREAD), especially ENSG00000074181 (NOTCH3) in breast cancer and ENSG00000080824 (HSPA90AA1) in colorectal cancer, ENSG00000183020 (AP2A2) in lung cancer may be associated with related tissue-specific cancer pathways, and ENSG00000160789 (LMNA), one of the downstream intron retention genes in prostate cancer, may also be associated with intron retention in these pathways, and therefore, it was suggested to be examined. According to the literature reviews and the data obtained as a result of the research, it was suggested that pathway analyses should be performed, validation studies should be performed, and new clues for determining the pathogenesis of the disease could be discovered by taking into account the common intron regions found in IRFinder, IRFinder-S, and İREAD algorithms.
Benzer Tezler
- Determining novel target genes in WNT/𝛽-catenin signaling pathway using machine learning
WNT/beta-catenin sinyal yolağında makine öğrenmesi ile hedef genler belirlenmesi
CEMRE KEFELİ
Yüksek Lisans
İngilizce
2022
Genetikİstanbul ÜniversitesiMoleküler Biyoloji ve Genetik Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ANDRES OCTAVIO ARAVENA DUARTE
- Identification of oncostatin M target genes by RNA-seq in mouse primary myotube cells
Fare birincil miyotüp hücrelerinde RNA-seq ile oncostatin M hedef genlerinin tanımlanması
AYNUR ERKIN KASHGARI
Yüksek Lisans
İngilizce
2021
BiyolojiKoç ÜniversitesiMoleküler Biyoloji ve Genetik Ana Bilim Dalı
DR. ÖĞR. ÜYESİ SERKAN KIR
- Boruta ve Elastik Ağ Algoritmalarının Gen Seçim Performanslarının RNA Dizileme Veri Setleri Üzerinde Karşılaştırılması: Bir Monte Carlo Benzetim Çalışması
Comparison of Gene Selection Performances of Boruta and Elastic Net Algorithms on RNA Sequencing Data: A Monte Carlo Simulation Study
ÖZGÜR SAMAN
Yüksek Lisans
Türkçe
2023
BiyoistatistikHacettepe ÜniversitesiBiyoistatistik Ana Bilim Dalı
DOÇ. DR. OSMAN DAĞ
- A systems biology approach for the identification of gene expression signatures for cancer diagnosis, prognosis, and response to radiotherapy
Sistem biyolojisi yaklaşımlarıyla kanserin tanısı, prognozu ve radyoterapiye yanıt için gen ekspresyon imzalarının tanımlanması
HALİL İBRAHİM TOY
Doktora
İngilizce
2022
BiyoistatistikDokuz Eylül ÜniversitesiMoleküler Biyoloji ve Genetik Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ATHANASIA PAVLOPOULOU
DOÇ. DR. GÖKHAN KARAKÜLAH
- Cbioportal aracı kullanarak ferroptoz direnci ve hassasiyeti ile ilişkili genlerin araştırılması
Investigation of genes associated with ferroptosis resistance and sensitivity using the cbioportal tool
MEHMET GÖKHAN ERTUĞRUL
Yüksek Lisans
Türkçe
2024
BiyolojiZonguldak Bülent Ecevit ÜniversitesiMoleküler Biyoloji Ana Bilim Dalı
DR. ÖĞR. ÜYESİ KEREM MERT ŞENSES