Integrative clustering approaches for cancer subtype discovery
Bütünleyici kümeleme algoritmaları ile kanser altgruplarının tespiti
- Tez No: 490137
- Danışmanlar: YRD. DOÇ. DR. HİLAL KAZAN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Biyoistatistik, Computer Engineering and Computer Science and Control, Biostatistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2017
- Dil: İngilizce
- Üniversite: Antalya Bilim Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 72
Özet
Kanser heterojen bir hastalık oldugu icin kanser altgruplarının bulunması kisiye ozgu tedavi ve terapilerin gelistirilmesi icin kritik onem tasımaktadır. Son zamanlarda hız kazanan kanser genom projeleri binlerce kanser hastası icin bircok tipte genomik veri uretmektedir. Bu farklı tipteki verileri aynı anda dikkate alarak var olan tamamlayıcı bilgilerden faydalanmak kanser altgruplarının bulunmasında avantaj saglayabilir. Tezin ilk kısmında, ¸cok-tipli kernel k-ortalama algoritmasıyla üç farklı veri tipini (gen ifadesi, DNA metilasyon,miRNA ifadesi) entegre ettik ve iki farklı kanser verisinde uyguladık. Farklı veri tiplerinden elde edilen kernel matrislerini ogrenilen agırlıklarla birlestirmenin,bu kernelleri es oranlarla birlestirmekten ya da veri tiplerini bagımsız olarak kullanmaktan daha iyi sonuc verdigini gozlemledik. Ayrıca, elde edilen sonuçların deneylerin buyuk cogunlugunda var olan yontemlerden daha iyi sonuclar verdigini gosterdik. Elde edilen kumelerin biyolojik anlamlılıgını gostermek amacıyla Kaplan-Meier analizini uyguladıgımızda kumelerin istatistiksel olarak farklı sagkalım profilleri gosterdigini gozlemledik. Tezin ikinci kısmında genomik verilerin ¸cok-boyutluluk problemini hedefleyerek var olan bir seyrek k-ortalama algoritmasını cok-tipli verilere uygulanacak sekilde gelistirdik. Gelistirilen yontemde hem oznitelikler icin hem de veri tipleri icin agırlıklar ogrenilmekte, boylece tamamlayıcı kumeleme ve oznitelik secimi aynı anda gerceklestirilebilmektedir. Yaptıgımız deneylerin buyuk cogunlugunda oznitelik seciminin diger yontemlerden daha iyi sonuc verdigini gozlemledik. Sonuc olarak, her iki kısımdan elde edilen sonuclar dusunuldugunde, farklı genomik veri tiplerinin birlestirilmesinin ve buna ek olarak oznitelik seciminin uygulanması ile elde edilen altgrupların var olan altgruplara gore daha iyi oldugunu gosterdik.
Özet (Çeviri)
Cancer is a heterogeneous disease and identification of cancer subtypes is critical for personalized treatment and drug development. Recently, cancer genome projects have produced multiple types of high-throughput data for thousands of cancer patients. Exploiting the complementary information between different data types can improve finding subtypes. In the first part of this thesis, we apply multi-view kernel k-means to integrate multiple genomic datasets (i.e.,gene expression, DNA methylation and miRNA expression) on two cancer datasets. We show that combining kernels (i.e., that correspond to different views) with learned weights give better clusters compared to combining the kernels uniformly or using each data set independently. We also demonstrate an improved performance compared to existing models that integrate the same data types. In terms of biological significance, Kaplan-Meier analysis shows that our discovered clusters have distinct survival profiles with statistically significant log-rank test p-values. In the second part, we target the high dimensionality problem of genomic datasets by extending a single-view sparse k-means framework to multi-view setting. This extension allows us to perform integrative clustering and feature selection simultaneously by learning both feature weights and view weights. We confirm that performing feature selection improves the clusters for the majority of the datasets. Altogether, our results indicate that integration of multiple genomic characterizations and the application of feature selection enable the discovery of subtypes that improve over current patient stratifications.
Benzer Tezler
- Efficient optimization algorithms for computational biology
Hesaplamalı biyolojide etkin eniyileme algoritmaları
OĞUZ CAN BİNATLI
Doktora
İngilizce
2024
Endüstri ve Endüstri MühendisliğiKoç ÜniversitesiEndüstri Mühendisliği ve Operasyon Yönetimi
PROF. DR. MEHMET GÖNEN
- Efficient machine learning models for cancer biology
Kanser biyolojisi için etkin yapay öğrenme modelleri
AYYÜCE BEGÜM BEKTAŞ
Doktora
İngilizce
2022
Endüstri ve Endüstri MühendisliğiKoç ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. MEHMET GÖNEN
- Identification of cancer patient subgroups via pathway based multi-view graph kernel clustering
Kanser hasta alt gruplarının yolak esaslı çok bakışlı çizge çekirdeği gruplaması ile belirlenmesi
ALİ BURAK ÜNAL
Yüksek Lisans
İngilizce
2017
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. ÖZNUR TAŞTAN OKAN
- ECM-guided ıntegrative network modeling for patient stratification
ECM yönlendirmeli entegre ağ modellemesiyle hasta siniflandirmasi
ASLI DANSIK
Yüksek Lisans
İngilizce
2024
BiyolojiKoç ÜniversitesiBiyoinformatik Sistemler Biyolojisi Ana Bilim Dalı
DOÇ. DR. NURCAN TUNÇBAĞ
DR. ÖĞR. ÜYESİ ECE ÖZTÜRK
- Superpixel assisted deep neural network for breast tumor segmentation in ultrasound images
Süperpiksel destekli derin sinir ağı ile meme ultrason görüntülerinde tümör segmentasyonu
NEFİSE UYSAL
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. ENDER METE EKŞİOĞLU
ÖĞR. GÖR. MURAT GEZER