Geri Dön

Interpretable cancer stage classification using sparse bayesian neural networks

Seyrek bayesian sinir ağları ile yorumlanabilir kanser evre sınıflandırması

  1. Tez No: 851075
  2. Yazar: HAZAL HASRET YURDAKUL
  3. Danışmanlar: PROF. DR. MEHMET GÖNEN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: İngilizce
  9. Üniversite: Koç Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Yapay Zeka Bilim Dalı
  13. Sayfa Sayısı: 78

Özet

Kanser moleküler özelliklerinin derinlemesine incelenmesini gerektirir. Hedeflenen tedavi stratejileri için kanser evrelerinin ayırt edilmesi esastır. Bu tez, gen ifade profillerini kullanarak erken ve geç evre kanserlerin ayrımına odaklanmıştır. Hesaplama tekniklerinin tıbbi araştırmalarla bütünleşmesiyle, makine öğrenimi modelleri bu görevde üstün başarı göstermektedir ve biyolojik mekanizmalara dair içgörüler sunmaktadır. Bu içgörüleri kullanabilmek için, seyreklik teşvik eden öncüllerle Bayesian Sinir Ağları (BNN) adında yeni bir yaklaşım öneriyoruz. Önerilen seyrek BNN'ler, kanser evrelerini belirlemede yüksek tahmin performansı sunarken yüksek düzeyde yorumlanabilirlik sağlamak için tasarlanmıştır. Seyrek BNN modellerimizi değerlendirmek için, onları 15 farklı kanser kohortunda üç makine öğrenimi algoritması ile karşılaştırdık. Çalışmamızın sonuçları, seyrek BNN modellerimizin geleneksel referans modellerle karşılaştırılabilir tahmin performanslarına ulaştığını göstermektedir. Ayrıca, sinir ağlarının tıpta kara kutu sorununu ele alıyoruz. Bu sorun, hangi girdi özelliklerinin tahminler için kritik olduğunu belirsiz bırakır ve önemli sonuçları olan karar verme sürecinde ciddi bir sorundur. Bu sorunu ele almak için, ana katkımız veri yorumlanabilirliğini önemli ölçüde artıran yeni bir BNN mimarisi geliştirmek olmuştur. Yaklaşımımızda, üç tür seyreklik teşvik eden öncülleri entegre ettik: Laplace, Student t ve Sivri ve Taban. Her bir öncülün sıfır ortalaması ve düşük varyansı vardır, bu da bağlantıların azaltılmasını teşvik eder ve böylece odaklanmış bir özellik seçimi sürecini mümkün kılar. Bu metodoloji, en etkili gen ifadelerini belirlememize ve üzerine odaklanmamıza olanak tanır. Analizimiz, seyrek BNN'lerin belirli gen setlerine belirgin bir tercih gösterdiğini ortaya koymaktadır. Sonuç olarak, seyrek BNN'lerin geliştirilmesi, kanser araştırmaları alanını anahtar gen yollarını aydınlatarak ve kanser evreleme sürecini önemli ölçüde iyileştirerek biyolojik olarak bilgilendirici ve yorumlanabilir bir araç sunar.

Özet (Çeviri)

Cancer requires an in-depth exploration of its molecular characteristics. For targeted treatment strategies, distinguishing cancer stages is essential. This thesis has focused on the differentiation of early- and late-stage cancers using gene expression profiles. With the integration of computational techniques into medical research, machine learning models excel in this task, offering insights into biological mechanisms. To harness these insights, we proposed a novel approach, which is Bayesian Neural Networks (BNNs) with sparsity-inducing priors. The proposed sparse BNNs are designed to deliver high predictive performance in identifying cancer stages while maintaining a high level of interpretability. To evaluate our sparse BNN models, we benchmarked them against three machine learning algorithms across 15 different cancer cohorts. The results of our study revealed that our sparse BNN models achieve predictive performances comparable to traditional benchmark models. Additionally, we addressed the black-box issue of neural networks in medicine, which obscures which input features are crucial for predictions, a serious issue in decision-making with significant implications. To address this issue, our primary contribution has been the development of a novel BNN architecture that considerably enhances data interpretability. In our approach, we have integrated three types of sparsity inducing priors, namely, Laplace, Student's t, and Spike-and-Slab. Each prior has a mean of zero and low variance, promoting a reduction in connections and thus enabling a focused feature selection process. This methodology allows us to identify and concentrate on the most influential gene expressions. Our analysis revealed that sparse BNNs show a distinct preference for specific gene sets. In conclusion, the development of sparse BNNs offers a biologically informative and interpretative tool, enhancing the field of cancer research by shedding light on key gene pathways and significantly improving the process of cancer staging.

Benzer Tezler

  1. A multilayer perceptron framework for sparse multiple kernel learning

    Seyrek çoklu çekirdek öğrenimi için çok katmanlı bir perseptron çerçevesi

    BİNNUR ŞAHİN

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKoç Üniversitesi

    Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı

    PROF. DR. MEHMET GÖNEN

  2. Gene set-based classification models for cancer biology

    Kanser biyolojisi için gen kümesi tabanlı sınıflandırma modelleri

    AREZOU RAHIMI

    Doktora

    İngilizce

    İngilizce

    2020

    Endüstri ve Endüstri MühendisliğiKoç Üniversitesi

    Endüstri Mühendisliği ve Operasyon Yönetimi

    DOÇ. DR. MEHMET GÖNEN

  3. Efficient optimization algorithms for computational biology

    Hesaplamalı biyolojide etkin eniyileme algoritmaları

    OĞUZ CAN BİNATLI

    Doktora

    İngilizce

    İngilizce

    2024

    Endüstri ve Endüstri MühendisliğiKoç Üniversitesi

    Endüstri Mühendisliği ve Operasyon Yönetimi

    PROF. DR. MEHMET GÖNEN

  4. Survival prediction via partial ordering in feature space and sample space

    Öznitelik ya da örneklem uzayında kısmi sıralama yoluyla sağkalım tahminleme

    MUSTAFA BÜYÜKÖZKAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2016

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. ÖZNUR TAŞTAN OKAN

  5. Breast cancer detection with convolutional neural network using ultrasound images

    Başlık çevirisi yok

    JIHAD JAMAL OTHMAN OTHMAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolTokat Gaziosmanpaşa Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ YASEMİN ÇETİN KAYA