Geri Dön

A weakly supervised clustering method for cancer subgroup identification

Kanser alt gruplarının keşfi için zayıf gözetimli bir kümeleme metodu

  1. Tez No: 434223
  2. Yazar: DUYGU ÖZÇELİK
  3. Danışmanlar: YRD. DOÇ. ÖZNUR TAŞTAN OKAN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2016
  8. Dil: İngilizce
  9. Üniversite: İhsan Doğramacı Bilkent Üniversitesi
  10. Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 114

Özet

Kanser heterojen bir hastalıktır; her bir kanser tipi moleküler, histopatolojik ve klinik olarak farklılıklar gösteren bir çok alt tipi barındırır. Bir kanser tipine ait alt gruplarının belirlenmesi, kişiye özel ve hedefe yönelik tedavi yöntemleri geliştirilebilmesini ve alt tiplerin moleküler karakteristiklerinin anlaşılmasıyla hastalığın mekanizmalarına dair bilgileri açığa çıkarabilmesini mümkün kıldığı için önemlidir. Geleneksel olarak kanser alt gruplarını keşfetmek için genomik veriler üzerinde gözetimsiz kümeleme teknikleri uygulanır ve bu yolla belirlenen gruplar, ancak hasta sağ kalımı gibi kritik bir parametre açısından ilişkililer ise anlamlı olarak değerlendirilirler. Biz bu gözetimsiz öğrenme çerçevesi yerine, WS-RFClust adını verdiğimiz, grupların ayrışmasına klinik parametrenin yön verdiği zayıf gözetimli bir kümeleme tekniği öneriyoruz. Bu yöntemde, rastgele orman sınıflandırıcısı kurulup, ormandaki ağaçların ara dallarında hastaların aynı gruplara düşüp düşmediği bilgisine dayalı olarak bir hasta benzerlik matrisi oluşturulmaktadır. Bu matris daha sonra bir kümeleme algoritmasına girdi olarak verilmekte ve hasta grupları bulunmaktadır. WS-RFClust, yapısı gereği sınıflandırma adımında oluşturulan, özniteliklerin doğrusal olmayan kombinasyonlarından oluşan öznitelik alt uzayını kullanmaktadır. WS-RFClust yöntemini el yazısı rakamlarında kullandığımızda, rakamların yapısal özelliklerini yakaladığını görmekteyiz. WS-RFClust'ın mRNA, protein ve microRNA ifadeleme veri setlerini kullanarak meme kanserini alt tiplerini bulmak için uyguladığımızda genel geçer kullanılan gözetimsiz kümeleme teknikleri ile oluşan kümelemelerden daha iyi çalıştığını göstermekteyiz.

Özet (Çeviri)

Each cancer type is a heteregonous disease consisting of subtypes, which may be distinguished at the molecular, histopathological, and clinical level. Identifying the patient subtypes of a cancer type is critically important as the unique molecular characteristics of a particular patient subgroup reveal distinct disease states and opens up possibilities for targeted therapeutic regimens. Traditionally, unsupervised clustering techniques are applied on the genomic data of the tumor samples and the patient clusters are found to be of interest if they can be associated with a clinical outcome variable such as the survival of patients. In lieu of this unsupervised framework, we propose a weakly supervised clustering framework, WS-RFClust, in which the clustering partitions are guided with the clinical outcome of interest. In WS-RFClust a random forest is trained to classify the patients based on a categorical clinical variable of interest. We use the partitions of patients on the tree ensemble to construct a patient similarity matrix, which is then used as input to a clustering algorithm. WS-RFClust inherently uses the nonlinear subspace of the original features that is learned in the classification step for clustering. In this study, we demonstrate the effectiveness of WS-RFClust on hand-written digit datasets, which captures salient structural similarities of digit pairs. Finally, we employ WS-RFClust to find breast cancer subtypes using mRNA, protein and microRNA expressions as features. Our results on breast cancer subtype identification problem show that WS-RFClust could identify patients more effectively in comparison to the commonly used unsupervised clustering methods.

Benzer Tezler

  1. Novel multiple instance learningmodels for digital histopathology

    Başlık çevirisi yok

    MUSTAFA UMIT ONER

    Doktora

    İngilizce

    İngilizce

    2021

    Elektrik ve Elektronik MühendisliğiNational University of Singapore (NUS)

    YRD. DOÇ. DR. LEE HWEE KUAN

    PROF. SUNG WİNG-KİN,

  2. Fisher kernel based models for image classification and object localization

    Başlık çevirisi yok

    RAMAZAN GÖKBERK CİNBİŞ

    Doktora

    İngilizce

    İngilizce

    2014

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolUniversité de Grenoble

    DR. CORDELIA SCHMID

    DR. JAKOB VERBEEK

  3. Short term electricity load forecasting with deep learning

    Derin öğrenme ile kısa dönemli elektrik yük talep tahmini

    İBRAHİM YAZICI

    Doktora

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ÖMER FARUK BEYCA

  4. Utilizing weakly-supervised learning for hashtag segmentation and named entity disambiguation

    Zayıf denetimli öğrenme yaklaşımı kullanarak hashtag ayrıştırma ve varlık ismi anlamlandırma

    ARDA ÇELEBİ

    Doktora

    İngilizce

    İngilizce

    2020

    Bilgi ve Belge YönetimiBoğaziçi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ARZUCAN ÖZGÜR TÜRKMEN

  5. Weakly-supervised relation extraction

    Zayıf denetlenen ilişki çıkarımı

    SEÇKİN ŞEN

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. İLYAS ÇİÇEKLİ