Geri Dön

Mikroarray gen ekspresyon veri setlerinde random forest ve naıve bayes sınıflama yöntemleri yaklaşımı

Random forest and naïve bayes approach in microarray gene expressions data sets

  1. Tez No: 329788
  2. Yazar: EBRU KORKEM
  3. Danışmanlar: DOÇ. DR. ERDEM KARABULUT
  4. Tez Türü: Yüksek Lisans
  5. Konular: Biyoistatistik, Genetik, Biostatistics, Genetics
  6. Anahtar Kelimeler: Random Forest, Naive Bayes, DNA Mikroarray, Sınıflama, Random Forest, Naive Bayes, DNA Microarray, Classification
  7. Yıl: 2013
  8. Dil: Türkçe
  9. Üniversite: Hacettepe Üniversitesi
  10. Enstitü: Sağlık Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Biyoistatistik Ana Bilim Dalı
  12. Bilim Dalı: Biyoistatistik Bilim Dalı
  13. Sayfa Sayısı: 65

Özet

Ebru KORKEM Mikroarray Gen Ekspresyon Veri Setlerinde Random Forest ve Naive Bayes Sınıflama Yöntemleri Yaklaşımı. Hacettepe Üniversitesi Sağlık Bilimleri Enstitüsü, Biyoistatistik Programı Yüksek Lisans Tezi, ANKARA, 2012. Bu tez çalışmasında çeşitli kanser türlerine ilişkin farklı büyüklükteki ve farklı sınıf sayılarındaki veri setleri üzerinde, Random Forest ve Naive Bayes sınıflama yöntemleri karşılaştırılmıştır. İki sınıflama yönteminin de her bir veri seti için ayrı ayrı doğru sınıflama oranları, iki sınıflı veri setlerinde (hasta, sağlam) yöntemlerin başarısını karşılaştırmak için ise duyarlılık, seçicilik, kesinlik, F-ölçütü gibi performans ölçüleri hesaplanmıştır. Ayrıca Random Forest yönteminde her veri seti için önemli genler ?doğru sınıflama oranındaki ortalama azalma? değerlerine göre hesaplanmış ve ilk 10 önemli genin gerçekte de sınıflar arasında farklılık gösterip gösterilmediğine bakılmıştır. Random Forest yönteminde ağaçlardaki en uygun değişken sayısına karar vermek için 5 farklı mtry değeri üzerinde çalışılmış (0.5P, 0.1P, P, 1.2 ?P, ?P ) ve en uygun mtry değerine göre sınıflama yapılmıştır. Random Forest ve Naive Bayes'in kanser veri setleri üzerindeki performansları bu değerlerle karşılaştırılmıştır. Her iki sınıflama yönteminin hem ikili hem de çoklu sınıflama da performansları incelenmiş olup sonuçlarda, iki yöntem arasında fark gözlenmemiştir.

Özet (Çeviri)

Ebru KORKEM Random Forest and Naïve Bayes Approach in Microarray Gene Expressions Data Sets. Hacettepe University Institute of Health Sciences, Biostatistic Program Master Degree Thesis, ANKARA, 2012. In this study, two classification methods, Random Forest and Naive Bayes, were compared about various types of cancer on the data sets which are different in size or in number of classes. Correct classification rates of two classification methods for each data set were separately calculated and additionally in two-class data sets (patient-healthy), performance measures like sensitivity, specifity, precision and F-measure were calculated for success comparison of the methods. Also in Random Forest method, for each data set important genes were calculated according to the values of ?mean decrease in accuracy? and it was investigated if in reality first 10 important genes were differed between the classes. In Random Forest method, five different mtry values (0.5P, 0.1P, P, 1.2 ?P, ?P ) were studied to determine the appropriate number of variables in the trees and classification procedure was performed according to that appropriate mtry value. Performances of Random Forest and Naive Bayes on cancer data sets were compared with these values. Each classification method?s performance was examined in binary and multi-class classification and in conclusion it was observed that there weren?t any differences between those two methods.

Benzer Tezler

  1. New approach to unsupervısed based classıfıcatıon on mıcroarray data

    Mi̇krodi̇zi̇li̇m veri̇lerden danışmansız öğrenmeye dayalı sınıflamada yeni̇ yaklaşım

    ERDAL COŞGUN

    Doktora

    İngilizce

    İngilizce

    2013

    BiyoistatistikHacettepe Üniversitesi

    Biyoistatistik Ana Bilim Dalı

    PROF. DR. ERGUN KARAAĞAOĞLU

  2. Hepatit C virüs-ilişkili hepatoselüler karsinomda moleküler patogenezin ve yeni biyobelirteçlerin biyoinformatik analiz ile araştırılması

    Investigation of molecular pathogenesis and novel biomarkers in hepatitis C virus-associated hepatocellular carcinoma by bioinformatics analysis

    YAĞMUR KURT DEMİRTAŞ

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    BiyokimyaEge Üniversitesi

    Tıbbi Biyokimya Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ SEVCAN ATAY

  3. Using systems based models to uncover the disease network of Psoriasis and its associations with other autoimmune-related diseases

    Sistem esaslı modeller kullanarak sedef hastalığı ağının ve diğer bağışıklık sistemi ile ilintili hastalık ağlarının oluşturulması

    TUBA SEVİMOĞLU

    Doktora

    İngilizce

    İngilizce

    2015

    BiyomühendislikMarmara Üniversitesi

    Biyomühendislik Ana Bilim Dalı

    DOÇ. DR. KAZIM YALÇIN ARĞA

  4. Development of a shiny application for comparative transcriptomics and differential gene expression

    Karşılaştırmalı transkriptomik ve diferansiyel gen ekspresyonu için bir shiny uygulamasının geliştirilmesi

    RONALDO LEKA

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Biyolojiİhsan Doğramacı Bilkent Üniversitesi

    Moleküler Biyoloji ve Genetik Ana Bilim Dalı

    DOÇ. DR. ÖZLEN KONU KARAKAYALI

  5. Kanser genetiği veritabanı oluşturulması ve biyoinformatik araçlarına entegrasyonu ile yeni kanser veri setlerinin analizi

    Developing cancer genomic database and analyzing cancer datasets with integrating bioinformatic tools

    MEHMET KEMAL SAMUR

    Doktora

    Türkçe

    Türkçe

    2013

    BiyoistatistikAkdeniz Üniversitesi

    Biyoistatistik ve Tıbbi Bilişim Ana Bilim Dalı

    PROF. DR. OSMAN SAKA