Geri Dön

A pan-cancer study using TCGA datasets to find possible novel prognostic markers

Yeni olası prognostik belirteçlerin bulunması amacıyla TCGA veri setleri kullanılarak yapılan bir pan-kanser çalışması

  1. Tez No: 668125
  2. Yazar: BATUHAN KISAKOL
  3. Danışmanlar: DR. MEHMET BAYSAN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2020
  8. Dil: İngilizce
  9. Üniversite: Marmara Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Veri Bilimi Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 58

Özet

Kanser günümüzde en sık görülen ölüm nedenleri arasındadır. Bu hastalık, hücrelerin doğal olmayan yollarla ve kontrol edilemez bir şekilde büyüyerek diğer normal dokuları tehdit etmesi olarak tarif edilebilir. Yüzyıllardır kanser üzerinde yapılagelen çalışmalar Yeni Nesil Dizileme (YND) teknolojilerinin son yıllardaki gelişimi ile dikkate değer bir seviyeye erişmiştir. Mevzubahis teknoloji sayesinde hem kanser çalışmalarının kapsamı genişlemiş hem de insanlığı tehdit eden bu hastalığın kompleks yapısı günümüzde daha iyi kavranmaya başlanmıştır. YND teknolojilerinin sunduğu imkan çerçevesinde son zamanlarda büyük epigenetik, genetik ve transkriptomik veri setleri üretilmiştir. Bunun yanında, kanser artık bir organ hastalığı olarak değil, moleküler bir hastalık olarak görülmeye başlanmıştır. Bu tezde üç farklı moleküler veri seti kullanılarak bir pan-kanser çalışması yapılmaktadır. DNA metilasyon, DNA kopya sayısı, DNA mutasyon ve RNA ekspresyonu seviyelerini gösteren veri setleri TCGA portalinden indirilerek kullanılmaktadır. Bu çalışma mümkün olan en fazla sayıda kanser için moleküler veri kümelerini kullanarak yeni prognostik belirteçler bulmayı amaçlamaktadır. Bu hedefi gerçekleştirmek için, bu tezde daha önceden önerilen prognostik belirteçler (altklon sayısı ve çeşitlilik indeksleri gibi) ile beraber dört veri setindeki her prob/gen'in toplam varyansları da yeni birer olası belirteç olarak kullanılmaktadır. Ayrıyeten sunulan bu yeni belirteçler ile öncekiler arasındaki istatistiki ilişkiler ortaya konulmaktadır. Çalışmanın çıktıları, DNA metilasyonundaki toplam mutlak değişimin, pan-kanserde ve spesifik olarak bazı kanser tiplerinde, sağkalım üzerinde önemli bir belirteç olabileceğini göstermektedir. Ayrıca makine öğrenmesi ve derin öğrenme metodlarıyla beraber bu olası göstergeleri tahmin eden modeller geliştirilmektedir. Sonuçlar hangi modellerin hangi veri setleri üzerinde verimli çalıştıklarını göstermektedir

Özet (Çeviri)

Cancer is one of the most common causes of death worldwide. It can be described as the unnatural and uncontrollable growth of cells, which may lead to spreading other normal tissues. This major threat to human life has been studied for centuries. Yet, with the emergence of Next-Generation Sequencing (NGS) technologies, scope of these studies are expanded and better comprehension of the structure of such complex disease became possible. Through these developments, massive datasets regarding genetics, epigenetics, and transcriptomics are produced in cancer studies. Besides, advancement in technologies revealed that cancer might be treated as a molecular disease rather than a disease of an organ. Therefore, in this thesis, a pan-cancer study is conducted by using three-level molecular datasets. DNA methylation, DNA Copy Number, DNA Mutation, and RNA expression datasets from TCGA Portal are available to process. This study aims to find novel prognostic markers by using all possible datasets in as many cancer types as possible. For this purpose, prognostic markers, such as subclone numbers and diversity indexes, are used along with new proposed indexes, total variances for each gene/probe on four datasets. Association between these proposed indexes and existing ones are also demonstrated. Results suggest that total absolute change in DNA methylation might be a significant marker in pan-cancer and some particular cancer types. Moreover, this study investigates several machine learning and deep learning models to predict these possible indicators. Findings show which models are more suitable in which circumstances.

Benzer Tezler

  1. Machine learning approach to quantification of intra-tumour heterogeneity using genomic, epigenomic and proteomic data

    Genomik, epigenomik ve proteomik verileri kullanarak tümor içi heterojenite nicelleştirmesine makine öğrenmesi yaklaşımı

    ERSİN ONUR ERDOĞAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Üniversitesi-Cerrahpaşa

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ÖZGÜR CAN TURNA

  2. Dek izoformlarının transkripsiyon profillerinin karşılaştırılması

    Comparison of transcription profiles of dek isoforms

    DİLAN YOLERİ

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    BiyolojiGebze Teknik Üniversitesi

    Moleküler Biyoloji ve Genetik Ana Bilim Dalı

    PROF. DR. AYTEN KANDİLCİ

  3. Primer mide adenokarsinomlarının immunohistokimya ve insitu hibridizasyon yöntemleri ile moleküler sınıflaması, TRK yolağının sınıflamadaki olası rolünün belirlenmesi, klinikopatolojik parametreler ile ilişkilerinin değerlendirilmesi

    Molecular classification of gastric cancer based on immunohistochemistry and in-situ hybridization, determination of the role of tropomyosin receptor kinase (TRK) signaling pathway in gastric cancer classification and their association with clinicopathological parameters

    MEDİNE ÖZGÜR GÜNAY

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2020

    PatolojiMarmara Üniversitesi

    Tıbbi Patoloji Ana Bilim Dalı

    PROF. DR. ÇİĞDEM ÇELİKEL

  4. SOX2 in focus: Association of SOX2 copy number variation with TP53 mutation in TCGA pancancer cohorts and codon optimized design for de novo SOX2 synthesis using novel shiny application

    SOX2 odak noktasında: SOX2 gen kopya sayısı varyosyonunun TCGA pancancer kümelerinde TP53 mutasyonu ile ilişkisi ve shiny uygulaması kullanılarak de novo SOX2 sentezi için kodon optimize tasarım

    SİBER GÜNEŞ ÇELİK

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Biyolojiİhsan Doğramacı Bilkent Üniversitesi

    Nörobilim Ana Bilim Dalı

    DOÇ. DR. ÖZLEN KONU KARAKAYALI

  5. Development of gene panels to complement clinical decision support systems for evaluating the efficacy of cancer therapies

    Kanser tedavilerinin etkinliğini değerlendirmek için klinik karar destek sistemlerini tamamlayıcı gen panellerinin geliştirilmesi

    BETÜL BUDAK

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    BiyomühendislikMarmara Üniversitesi

    Biyomühendislik Ana Bilim Dalı

    PROF. DR. KAZIM YALÇIN ARGA