Gen ekspresyon verilerinde kümelemeye dayalı yeni bir sınıflandırma yaklaşımı
A novel clustering based classification approach to gene expression datasets
- Tez No: 311357
- Danışmanlar: DOÇ. DR. ERDEM KARABULUT, YRD. DOÇ. DR. AHMET ÖZTÜRK
- Tez Türü: Yüksek Lisans
- Konular: Biyoistatistik, Biostatistics
- Anahtar Kelimeler: Kanser sınıflandırması, kümeleme, sınıflandırma, gap istatistiği, mikrodizin, Cancer classification, clustering, classification, gap statistic, microarray
- Yıl: 2012
- Dil: Türkçe
- Üniversite: Erciyes Üniversitesi
- Enstitü: Sağlık Bilimleri Enstitüsü
- Ana Bilim Dalı: Halk Sağlığı Ana Bilim Dalı
- Bilim Dalı: Biyoistatistik Bilim Dalı
- Sayfa Sayısı: 138
Özet
KISA ÖZETYeni moleküler genetik teknolojilerinin gelişimi ile birlikte, binlerce genin ekspresyon düzeyleri eş zamanlı olarak ölçülebilmekte ve uygun istatistiksel yöntemler ile kanser ve diğer birçok hastalığın tanıları konabilmektedir. Bu çalışmada 3 aşamalı kümelemeye dayalı hibrit bir kanser sınıflandırma yönteminin (HKSY) geliştirilmesi amaçlanmıştır. İlk aşamada HKSY, Gap istatistiğinin farklı oryantasyonlarını kombine ederek kanser alt sınıf sayısını tahmin etmektedir. Bu sayıya dayalı olarak ikinci aşamada HKSY, kümeleme geçerlilik ölçümlerini kullanmakta ve onları kombine ederek Birleştirici Hiyerarşik, k-Ortalamalar ve Medoidler Etrafında Bölümleme kümeleme algoritmaları arasında en iyi ayrılmış ve kararlı kümeleri veren optimum algoritmayı belirlemeyi amaçlamıştır. Son aşama, yöntemin tahminleyici kısmı olup, HKSY öğrenme kuralları elde etmek ve yeni örneklerin sınıflarını doğru tahminlemek için yeni oluşturulan sınıf etiketlerini kullanarak veri setini RBF-DVM algoritması ile eğitmektedir. 5 gerçek ve 3 türetilmiş veri setinden elde edilen deneysel sonuçlar oluşturulan yöntemin kanser alt sınıf sayısını doğru tahminleyebileceğini, bu sınıfları etkili biçimde ayırabileceğini ve yeni örnekleri doğru sınıflarına atayabileceğini göstermiştir.
Özet (Çeviri)
ABSTRACTWith the development of new molecular genetic technologies, it is now possible to measure the expression values of thousands of genes simultaneously and diagnose cancer and many other diseases using appropriate statistical methods. In this paper, we proposed a clustering based three-step hybrid cancer classification method (HCCM) which contains both discovery and prediction of the cancer classes. In first step, HCCM determines the number of cancer classes with combining different orientations of Gap statistic. Base on this number, in second step HCCM uses cluster validation measures and combine them to find the optimum algorithm among Agglomerative Hierarchical, k-Means and Partitioning Around Medoids clustering algorithms which gives most seperate and stable cancer classes. Last step is the predictive part of our method that HCCM trains the data with RBF-SVM algorithm using new generated classes to obtain learning rules and estimate new tissue sample classes accurately. Experimental results from 5 real and 3 simulated datasets revealed that the proposed method can predict the true number of cancer classes, discriminate these classes efficiently, also can classify new tissue samples to correct classes.
Benzer Tezler
- New approach to unsupervısed based classıfıcatıon on mıcroarray data
Mi̇krodi̇zi̇li̇m veri̇lerden danışmansız öğrenmeye dayalı sınıflamada yeni̇ yaklaşım
ERDAL COŞGUN
Doktora
İngilizce
2013
BiyoistatistikHacettepe ÜniversitesiBiyoistatistik Ana Bilim Dalı
PROF. DR. ERGUN KARAAĞAOĞLU
- CAP-RNAseq: An online platform for RNA-seq data clustering, annotation and prioritization based on gene essentiality and congruence between mRNA and protein levels
CAP-RNAseq: Gen esansiyelliğine ve mRNA ve protein düzeyleri arasindaki uyuma dayalı RNA-seq veri kümeleme, annotasyon ve önceliklendirme için çevrimiçi bir platform
MERVE VURAL ÖZDENİZ
Doktora
İngilizce
2024
Biyoistatistikİhsan Doğramacı Bilkent ÜniversitesiNörobilim Ana Bilim Dalı
DOÇ. DR. ÖZLEN KONU KARAKAYALI
- Mikrodalga uygulanan MIR604 ve MON810 mısır unlarının omik yaklaşım ile karakterizasyonu
Characterization of microwave-treated MIR604 and MON810 maize flours with omics approach
BEGÜM ZEYNEP HANÇERLİOĞULLARI
Doktora
Türkçe
2024
Gıda MühendisliğiHacettepe ÜniversitesiGıda Mühendisliği Ana Bilim Dalı
PROF. DR. REMZİYE YILMAZ
- Count based clustering and classification of RNA-seq data
RNA dizileme verilerinin kesikli yöntemler ile sınıflandırılması ve kümelendirilmesi
DİNÇER GÖKSÜLÜK
Doktora
İngilizce
2019
BiyoistatistikHacettepe ÜniversitesiBiyoistatistik Ana Bilim Dalı
PROF. DR. AHMET ERGUN KARAAĞAOĞLU
- TP53 META: A webtool to visualize effects of TP53 modulators and mutations on expression profiles with a focus on breast cancer
TP53 META: TP53 modülatörleri ve mutasyonlarının meme kanseri odağında gen ifade profillerine etkilerini görselleştiren bir web aracı
ABDUL MOIZ AFTAB
Yüksek Lisans
İngilizce
2024
Biyolojiİhsan Doğramacı Bilkent ÜniversitesiMoleküler Biyoloji ve Genetik Ana Bilim Dalı
DOÇ. DR. ÖZLEN KONU KARAKAYALI