Geri Dön

Gen ekspresyon verilerinde kümelemeye dayalı yeni bir sınıflandırma yaklaşımı

A novel clustering based classification approach to gene expression datasets

  1. Tez No: 311357
  2. Yazar: GÖKMEN ZARARSIZ
  3. Danışmanlar: DOÇ. DR. ERDEM KARABULUT, YRD. DOÇ. DR. AHMET ÖZTÜRK
  4. Tez Türü: Yüksek Lisans
  5. Konular: Biyoistatistik, Biostatistics
  6. Anahtar Kelimeler: Kanser sınıflandırması, kümeleme, sınıflandırma, gap istatistiği, mikrodizin, Cancer classification, clustering, classification, gap statistic, microarray
  7. Yıl: 2012
  8. Dil: Türkçe
  9. Üniversite: Erciyes Üniversitesi
  10. Enstitü: Sağlık Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Halk Sağlığı Ana Bilim Dalı
  12. Bilim Dalı: Biyoistatistik Bilim Dalı
  13. Sayfa Sayısı: 138

Özet

KISA ÖZETYeni moleküler genetik teknolojilerinin gelişimi ile birlikte, binlerce genin ekspresyon düzeyleri eş zamanlı olarak ölçülebilmekte ve uygun istatistiksel yöntemler ile kanser ve diğer birçok hastalığın tanıları konabilmektedir. Bu çalışmada 3 aşamalı kümelemeye dayalı hibrit bir kanser sınıflandırma yönteminin (HKSY) geliştirilmesi amaçlanmıştır. İlk aşamada HKSY, Gap istatistiğinin farklı oryantasyonlarını kombine ederek kanser alt sınıf sayısını tahmin etmektedir. Bu sayıya dayalı olarak ikinci aşamada HKSY, kümeleme geçerlilik ölçümlerini kullanmakta ve onları kombine ederek Birleştirici Hiyerarşik, k-Ortalamalar ve Medoidler Etrafında Bölümleme kümeleme algoritmaları arasında en iyi ayrılmış ve kararlı kümeleri veren optimum algoritmayı belirlemeyi amaçlamıştır. Son aşama, yöntemin tahminleyici kısmı olup, HKSY öğrenme kuralları elde etmek ve yeni örneklerin sınıflarını doğru tahminlemek için yeni oluşturulan sınıf etiketlerini kullanarak veri setini RBF-DVM algoritması ile eğitmektedir. 5 gerçek ve 3 türetilmiş veri setinden elde edilen deneysel sonuçlar oluşturulan yöntemin kanser alt sınıf sayısını doğru tahminleyebileceğini, bu sınıfları etkili biçimde ayırabileceğini ve yeni örnekleri doğru sınıflarına atayabileceğini göstermiştir.

Özet (Çeviri)

ABSTRACTWith the development of new molecular genetic technologies, it is now possible to measure the expression values of thousands of genes simultaneously and diagnose cancer and many other diseases using appropriate statistical methods. In this paper, we proposed a clustering based three-step hybrid cancer classification method (HCCM) which contains both discovery and prediction of the cancer classes. In first step, HCCM determines the number of cancer classes with combining different orientations of Gap statistic. Base on this number, in second step HCCM uses cluster validation measures and combine them to find the optimum algorithm among Agglomerative Hierarchical, k-Means and Partitioning Around Medoids clustering algorithms which gives most seperate and stable cancer classes. Last step is the predictive part of our method that HCCM trains the data with RBF-SVM algorithm using new generated classes to obtain learning rules and estimate new tissue sample classes accurately. Experimental results from 5 real and 3 simulated datasets revealed that the proposed method can predict the true number of cancer classes, discriminate these classes efficiently, also can classify new tissue samples to correct classes.

Benzer Tezler

  1. New approach to unsupervısed based classıfıcatıon on mıcroarray data

    Mi̇krodi̇zi̇li̇m veri̇lerden danışmansız öğrenmeye dayalı sınıflamada yeni̇ yaklaşım

    ERDAL COŞGUN

    Doktora

    İngilizce

    İngilizce

    2013

    BiyoistatistikHacettepe Üniversitesi

    Biyoistatistik Ana Bilim Dalı

    PROF. DR. ERGUN KARAAĞAOĞLU

  2. CAP-RNAseq: An online platform for RNA-seq data clustering, annotation and prioritization based on gene essentiality and congruence between mRNA and protein levels

    CAP-RNAseq: Gen esansiyelliğine ve mRNA ve protein düzeyleri arasindaki uyuma dayalı RNA-seq veri kümeleme, annotasyon ve önceliklendirme için çevrimiçi bir platform

    MERVE VURAL ÖZDENİZ

    Doktora

    İngilizce

    İngilizce

    2024

    Biyoistatistikİhsan Doğramacı Bilkent Üniversitesi

    Nörobilim Ana Bilim Dalı

    DOÇ. DR. ÖZLEN KONU KARAKAYALI

  3. Mikrodalga uygulanan MIR604 ve MON810 mısır unlarının omik yaklaşım ile karakterizasyonu

    Characterization of microwave-treated MIR604 and MON810 maize flours with omics approach

    BEGÜM ZEYNEP HANÇERLİOĞULLARI

    Doktora

    Türkçe

    Türkçe

    2024

    Gıda MühendisliğiHacettepe Üniversitesi

    Gıda Mühendisliği Ana Bilim Dalı

    PROF. DR. REMZİYE YILMAZ

  4. Count based clustering and classification of RNA-seq data

    RNA dizileme verilerinin kesikli yöntemler ile sınıflandırılması ve kümelendirilmesi

    DİNÇER GÖKSÜLÜK

    Doktora

    İngilizce

    İngilizce

    2019

    BiyoistatistikHacettepe Üniversitesi

    Biyoistatistik Ana Bilim Dalı

    PROF. DR. AHMET ERGUN KARAAĞAOĞLU

  5. TP53 META: A webtool to visualize effects of TP53 modulators and mutations on expression profiles with a focus on breast cancer

    TP53 META: TP53 modülatörleri ve mutasyonlarının meme kanseri odağında gen ifade profillerine etkilerini görselleştiren bir web aracı

    ABDUL MOIZ AFTAB

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Biyolojiİhsan Doğramacı Bilkent Üniversitesi

    Moleküler Biyoloji ve Genetik Ana Bilim Dalı

    DOÇ. DR. ÖZLEN KONU KARAKAYALI