Novel statistical approaches in survival analysis of RNA-sequencing data
RNA-dizileme verilerinin sağkalım analizlerinde yeni istatistikselyaklaşımlar
- Tez No: 862521
- Danışmanlar: PROF. DR. ERDEM KARABULUT, DOÇ. DR. GÖKMEN ZARARSIZ
- Tez Türü: Doktora
- Konular: Biyoistatistik, Biostatistics
- Anahtar Kelimeler: sağkalım, RNA-dizileme, voom, stacking, IPF-Lasso, survival, RNA-sequencing, voom, stacking, IPF-Lasso
- Yıl: 2024
- Dil: İngilizce
- Üniversite: Hacettepe Üniversitesi
- Enstitü: Sağlık Bilimleri Enstitüsü
- Ana Bilim Dalı: Biyoistatistik Ana Bilim Dalı
- Bilim Dalı: Biyoistatistik Bilim Dalı
- Sayfa Sayısı: 192
Özet
Kansere yakalanan insanların sayısı her geçen gün artmaktadır ve birçok kanser türüne ait biyobelirteçler bilinemediği için bu hastalıktan ölüm oranları da sürekli artış göstermektedir. Ayrıca, her kanser hastalığı her hastada aynı şekilde seyretmemekte ve her hasta aynı tedaviye aynı yanıtı vermemektedir. Bu aşamada, bireysel tıp stratejilerinden da yararlanarak daha doğru prognoz tahminleri yaparak daha etkili tedaviler uygulamak oldukça önemlidir. Kanser hastalarında olay zamanı değişkenlerinden yararlanarak sağkalım tahminlemesi yapmak bize çok önemli sonuçlar sağlamaktadır. Omics teknolojilerinin de gelişmesiyle birlikte artık sağkalım zamanı ve hastaların gen ifade profilleri arasındaki ilişki modellenebilmektedir. Bu çalışmalarda son yıllarda avantajlarından dolayı RNA-dizileme verileri kullanılmaktadır. Ancak, RNA-dizileme verileri klasik sağkalım verilerinden farklı olarak yüksek-boyutluluk, heterojenlik ve yüksek-korelasyonlı genleri bulundurma özelliklerine sahiptir. Bu özelliklerinden dolayı klasik sağkalım algoritmaları yerine düzenlileştirilmiş Cox yöntemleri ve sağkalım verilerine uyarlanmış makine öğrenmesi algoritmaları kullanılmaktadır. Ancak, düzenlileştirilmiş Cox yöntemleri Cox algoritmasının kullanımında sağlanması gereken bir takım varsayımları gerektirmektedir. Genellikle önce sınıflandırma problemleri için oluşturulup daha sonra sağkalım verilerine uyarlanan makine öğrenmesi algoritmaları da ek bir zaman ve çaba gerektirmektedir. Bu çalışmada, voom dönüşümü, stacking algoritması ve bloklu lasso yöntemlerini birleştirerek RNA-dizileme verilerinin sağkalım analizlerinde kullanılabilecek yeni yaklaşımlar geliştirilmesi amaçlanmıştır. Bu amaçla, stacking algoritması ile sağkalım verileri ikili sınıflandırma verilerine dönüştürülebilmektedir. Voom dönüşümü sonrası elde edilen gözlem ağırlıkları da priority-Lasso ve IPF-Lasso algoritmalarında kullanılarak voomStackPrio ve voomStackIPF adında iki adet yeni yaklaşım sunulmuştur. Geliştirdiğimiz bu yaklaşımlar TCGA veritabanından alınan on iki adet gerçek RNA-dizileme verisinde uygulanmıştır. Harrell'ın Concordance İndeksi kullanılarak literatürde yer alan diğer sağkalım algoritmaları ile performans karşılaştırılması yapılmıştır. Sonuçlar, çalışma kapsamında geliştirilen iki adet yeni yaklaşımın performansının diğer sağkalım algoritmaları ile benzer veya daha iyi olduğunu göstermiştir.
Özet (Çeviri)
The number of people with cancer is increasing daily, and the mortality for cancer is constantly increasing since the biomarkers of many cancer types are unknown. Also, cancer doesn't progress between individuals similarly, and all patients vary in response to the same treatment because of genetic differences. At this stage, it is very important to apply more effective treatments by making more accurate prognosis predictions using personalized medicine strategies. Estimating survival in cancer patients using survival time provides essential results. With the development of omics technologies, the relationship between survival time and gene expression profiles of patients can now be modeled. RNA-sequencing technology has been used in recent years for survival analysis omics-based due to its advantages. Although RNA-sequencing has many advantages, it differs from classical survival data with high-dimensionality, heterogeneity, and highly-correlated genes. Due to these problems, the regularized Cox methods and machine learning algorithms adapted to survival data are used instead of classical survival algorithms. However, the regularized Cox methods require some assumptions to be met using the Cox algorithm. Machine learning algorithms that are first created for classification problems and then adapted to survival data require additional time and effort. This study aims to develop new approaches that can be used in the survival analysis of RNA-sequencing data by combining voom transformation, stacking algorithm, and lasso methods with block structure. For this purpose, survival data can be converted into binary classification data with the stacking algorithm. Using the sample weights obtained after the voom transformation in priority-Lasso and IPF-Lasso algorithms, two new approaches are presented: voomStackPrio and voomStackIPF. Our approaches were applied to 12 real RNA-sequencing data from the TCGA database. Performance comparisons were made with other survival algorithms in the literature using Harrell's concordance index. The results showed that the performance of the two new approaches was similar or better than other survival algorithms.
Benzer Tezler
- Epidermal büyüme faktörü reseptörü (EGFR), hepatosit büyüme faktörü reseptörü (c-Met) ve c-erbB2 (HER2-neu) ile klinikopatolojik parametrelerin kordoma patogenez ve prognozundaki rolü
The role of EGFR, c-MET, c-erbB2 and clinicopathologic parameters in chordoma patogenesis and prognosis
ZEYNEP SEVER
Tıpta Uzmanlık
Türkçe
2010
PatolojiMarmara ÜniversitesiPatoloji Ana Bilim Dalı
YRD. DOÇ. DR. SÜHEYLA UYAR BOZKURT
- Sanal tarama ve çok boyutlu moleküler modelleme yöntemleri ile p53-MDM2 potansiyel inhibitörlerinin belirlenmesi
Identification of p53-MDM2 potential inhibitors with virtual screening and multidimensional molecular modeling methods
GÜLŞAH AYDIN
Doktora
Türkçe
2020
Kimyaİstanbul Teknik ÜniversitesiKimya Ana Bilim Dalı
PROF. DR. MİNE YURTSEVER
PROF. DR. SERDAR DURDAĞI
- Clinical assessment of the microwave imaging system forbreast cancer screening and early detection
Meme kanseri tarama ve erken tanı için mikrodalgagörüntüleme sisteminin klinik değerlendirmesi
ALEKSANDAR JANJIC
Doktora
İngilizce
2023
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
Prof. Dr. MEHMET ÇAYÖREN
Prof. Dr. İBRAHİM AKDUMAN
- Enhancing breast cancer detection with a hybrid machine learning approach
Hı̇brı̇t makı̇ne öğrenme yaklaşımı ı̇le göğüs kanserı̇ tespı̇tı̇nı̇n gelı̇ştı̇rı̇lmesı̇
MUSTAFA ETCİL
Yüksek Lisans
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAbdullah Gül ÜniversitesiElektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. BURCU GÜNGÖR
PROF. DR. V. CAGRİ GÜNGÖR
- RNA-dizileme verilerinin kümelenmesinde yeni istatistiksel yaklaşımlar
Novel statistical approaches in clustering RNA-sequencing data
AHU DURMUŞÇELEBİ
Yüksek Lisans
Türkçe
2019
BiyoistatistikErciyes ÜniversitesiBiyoistatistik Ana Bilim Dalı
DOÇ. DR. GÖKMEN ZARARSIZ