A weakly supervised clustering method for cancer subgroup identification
Kanser alt gruplarının keşfi için zayıf gözetimli bir kümeleme metodu
- Tez No: 434223
- Danışmanlar: YRD. DOÇ. ÖZNUR TAŞTAN OKAN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2016
- Dil: İngilizce
- Üniversite: İhsan Doğramacı Bilkent Üniversitesi
- Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 114
Özet
Kanser heterojen bir hastalıktır; her bir kanser tipi moleküler, histopatolojik ve klinik olarak farklılıklar gösteren bir çok alt tipi barındırır. Bir kanser tipine ait alt gruplarının belirlenmesi, kişiye özel ve hedefe yönelik tedavi yöntemleri geliştirilebilmesini ve alt tiplerin moleküler karakteristiklerinin anlaşılmasıyla hastalığın mekanizmalarına dair bilgileri açığa çıkarabilmesini mümkün kıldığı için önemlidir. Geleneksel olarak kanser alt gruplarını keşfetmek için genomik veriler üzerinde gözetimsiz kümeleme teknikleri uygulanır ve bu yolla belirlenen gruplar, ancak hasta sağ kalımı gibi kritik bir parametre açısından ilişkililer ise anlamlı olarak değerlendirilirler. Biz bu gözetimsiz öğrenme çerçevesi yerine, WS-RFClust adını verdiğimiz, grupların ayrışmasına klinik parametrenin yön verdiği zayıf gözetimli bir kümeleme tekniği öneriyoruz. Bu yöntemde, rastgele orman sınıflandırıcısı kurulup, ormandaki ağaçların ara dallarında hastaların aynı gruplara düşüp düşmediği bilgisine dayalı olarak bir hasta benzerlik matrisi oluşturulmaktadır. Bu matris daha sonra bir kümeleme algoritmasına girdi olarak verilmekte ve hasta grupları bulunmaktadır. WS-RFClust, yapısı gereği sınıflandırma adımında oluşturulan, özniteliklerin doğrusal olmayan kombinasyonlarından oluşan öznitelik alt uzayını kullanmaktadır. WS-RFClust yöntemini el yazısı rakamlarında kullandığımızda, rakamların yapısal özelliklerini yakaladığını görmekteyiz. WS-RFClust'ın mRNA, protein ve microRNA ifadeleme veri setlerini kullanarak meme kanserini alt tiplerini bulmak için uyguladığımızda genel geçer kullanılan gözetimsiz kümeleme teknikleri ile oluşan kümelemelerden daha iyi çalıştığını göstermekteyiz.
Özet (Çeviri)
Each cancer type is a heteregonous disease consisting of subtypes, which may be distinguished at the molecular, histopathological, and clinical level. Identifying the patient subtypes of a cancer type is critically important as the unique molecular characteristics of a particular patient subgroup reveal distinct disease states and opens up possibilities for targeted therapeutic regimens. Traditionally, unsupervised clustering techniques are applied on the genomic data of the tumor samples and the patient clusters are found to be of interest if they can be associated with a clinical outcome variable such as the survival of patients. In lieu of this unsupervised framework, we propose a weakly supervised clustering framework, WS-RFClust, in which the clustering partitions are guided with the clinical outcome of interest. In WS-RFClust a random forest is trained to classify the patients based on a categorical clinical variable of interest. We use the partitions of patients on the tree ensemble to construct a patient similarity matrix, which is then used as input to a clustering algorithm. WS-RFClust inherently uses the nonlinear subspace of the original features that is learned in the classification step for clustering. In this study, we demonstrate the effectiveness of WS-RFClust on hand-written digit datasets, which captures salient structural similarities of digit pairs. Finally, we employ WS-RFClust to find breast cancer subtypes using mRNA, protein and microRNA expressions as features. Our results on breast cancer subtype identification problem show that WS-RFClust could identify patients more effectively in comparison to the commonly used unsupervised clustering methods.
Benzer Tezler
- Novel multiple instance learningmodels for digital histopathology
Başlık çevirisi yok
MUSTAFA UMIT ONER
Doktora
İngilizce
2021
Elektrik ve Elektronik MühendisliğiNational University of Singapore (NUS)YRD. DOÇ. DR. LEE HWEE KUAN
PROF. SUNG WİNG-KİN,
- Fisher kernel based models for image classification and object localization
Başlık çevirisi yok
RAMAZAN GÖKBERK CİNBİŞ
Doktora
İngilizce
2014
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolUniversité de GrenobleDR. CORDELIA SCHMID
DR. JAKOB VERBEEK
- Short term electricity load forecasting with deep learning
Derin öğrenme ile kısa dönemli elektrik yük talep tahmini
İBRAHİM YAZICI
Doktora
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ÖMER FARUK BEYCA
- Utilizing weakly-supervised learning for hashtag segmentation and named entity disambiguation
Zayıf denetimli öğrenme yaklaşımı kullanarak hashtag ayrıştırma ve varlık ismi anlamlandırma
ARDA ÇELEBİ
Doktora
İngilizce
2020
Bilgi ve Belge YönetimiBoğaziçi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. ARZUCAN ÖZGÜR TÜRKMEN
- Weakly-supervised relation extraction
Zayıf denetlenen ilişki çıkarımı
SEÇKİN ŞEN
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. İLYAS ÇİÇEKLİ