Mikroarray gen ekspresyon veri setlerinde random forest ve naıve bayes sınıflama yöntemleri yaklaşımı
Random forest and naïve bayes approach in microarray gene expressions data sets
- Tez No: 329788
- Danışmanlar: DOÇ. DR. ERDEM KARABULUT
- Tez Türü: Yüksek Lisans
- Konular: Biyoistatistik, Genetik, Biostatistics, Genetics
- Anahtar Kelimeler: Random Forest, Naive Bayes, DNA Mikroarray, Sınıflama, Random Forest, Naive Bayes, DNA Microarray, Classification
- Yıl: 2013
- Dil: Türkçe
- Üniversite: Hacettepe Üniversitesi
- Enstitü: Sağlık Bilimleri Enstitüsü
- Ana Bilim Dalı: Biyoistatistik Ana Bilim Dalı
- Bilim Dalı: Biyoistatistik Bilim Dalı
- Sayfa Sayısı: 65
Özet
Ebru KORKEM Mikroarray Gen Ekspresyon Veri Setlerinde Random Forest ve Naive Bayes Sınıflama Yöntemleri Yaklaşımı. Hacettepe Üniversitesi Sağlık Bilimleri Enstitüsü, Biyoistatistik Programı Yüksek Lisans Tezi, ANKARA, 2012. Bu tez çalışmasında çeşitli kanser türlerine ilişkin farklı büyüklükteki ve farklı sınıf sayılarındaki veri setleri üzerinde, Random Forest ve Naive Bayes sınıflama yöntemleri karşılaştırılmıştır. İki sınıflama yönteminin de her bir veri seti için ayrı ayrı doğru sınıflama oranları, iki sınıflı veri setlerinde (hasta, sağlam) yöntemlerin başarısını karşılaştırmak için ise duyarlılık, seçicilik, kesinlik, F-ölçütü gibi performans ölçüleri hesaplanmıştır. Ayrıca Random Forest yönteminde her veri seti için önemli genler ?doğru sınıflama oranındaki ortalama azalma? değerlerine göre hesaplanmış ve ilk 10 önemli genin gerçekte de sınıflar arasında farklılık gösterip gösterilmediğine bakılmıştır. Random Forest yönteminde ağaçlardaki en uygun değişken sayısına karar vermek için 5 farklı mtry değeri üzerinde çalışılmış (0.5P, 0.1P, P, 1.2 ?P, ?P ) ve en uygun mtry değerine göre sınıflama yapılmıştır. Random Forest ve Naive Bayes'in kanser veri setleri üzerindeki performansları bu değerlerle karşılaştırılmıştır. Her iki sınıflama yönteminin hem ikili hem de çoklu sınıflama da performansları incelenmiş olup sonuçlarda, iki yöntem arasında fark gözlenmemiştir.
Özet (Çeviri)
Ebru KORKEM Random Forest and Naïve Bayes Approach in Microarray Gene Expressions Data Sets. Hacettepe University Institute of Health Sciences, Biostatistic Program Master Degree Thesis, ANKARA, 2012. In this study, two classification methods, Random Forest and Naive Bayes, were compared about various types of cancer on the data sets which are different in size or in number of classes. Correct classification rates of two classification methods for each data set were separately calculated and additionally in two-class data sets (patient-healthy), performance measures like sensitivity, specifity, precision and F-measure were calculated for success comparison of the methods. Also in Random Forest method, for each data set important genes were calculated according to the values of ?mean decrease in accuracy? and it was investigated if in reality first 10 important genes were differed between the classes. In Random Forest method, five different mtry values (0.5P, 0.1P, P, 1.2 ?P, ?P ) were studied to determine the appropriate number of variables in the trees and classification procedure was performed according to that appropriate mtry value. Performances of Random Forest and Naive Bayes on cancer data sets were compared with these values. Each classification method?s performance was examined in binary and multi-class classification and in conclusion it was observed that there weren?t any differences between those two methods.
Benzer Tezler
- New approach to unsupervısed based classıfıcatıon on mıcroarray data
Mi̇krodi̇zi̇li̇m veri̇lerden danışmansız öğrenmeye dayalı sınıflamada yeni̇ yaklaşım
ERDAL COŞGUN
Doktora
İngilizce
2013
BiyoistatistikHacettepe ÜniversitesiBiyoistatistik Ana Bilim Dalı
PROF. DR. ERGUN KARAAĞAOĞLU
- Hepatit C virüs-ilişkili hepatoselüler karsinomda moleküler patogenezin ve yeni biyobelirteçlerin biyoinformatik analiz ile araştırılması
Investigation of molecular pathogenesis and novel biomarkers in hepatitis C virus-associated hepatocellular carcinoma by bioinformatics analysis
YAĞMUR KURT DEMİRTAŞ
Yüksek Lisans
Türkçe
2021
BiyokimyaEge ÜniversitesiTıbbi Biyokimya Ana Bilim Dalı
DR. ÖĞR. ÜYESİ SEVCAN ATAY
- Using systems based models to uncover the disease network of Psoriasis and its associations with other autoimmune-related diseases
Sistem esaslı modeller kullanarak sedef hastalığı ağının ve diğer bağışıklık sistemi ile ilintili hastalık ağlarının oluşturulması
TUBA SEVİMOĞLU
Doktora
İngilizce
2015
BiyomühendislikMarmara ÜniversitesiBiyomühendislik Ana Bilim Dalı
DOÇ. DR. KAZIM YALÇIN ARĞA
- Development of a shiny application for comparative transcriptomics and differential gene expression
Karşılaştırmalı transkriptomik ve diferansiyel gen ekspresyonu için bir shiny uygulamasının geliştirilmesi
RONALDO LEKA
Yüksek Lisans
İngilizce
2022
Biyolojiİhsan Doğramacı Bilkent ÜniversitesiMoleküler Biyoloji ve Genetik Ana Bilim Dalı
DOÇ. DR. ÖZLEN KONU KARAKAYALI
- Kanser genetiği veritabanı oluşturulması ve biyoinformatik araçlarına entegrasyonu ile yeni kanser veri setlerinin analizi
Developing cancer genomic database and analyzing cancer datasets with integrating bioinformatic tools
MEHMET KEMAL SAMUR
Doktora
Türkçe
2013
BiyoistatistikAkdeniz ÜniversitesiBiyoistatistik ve Tıbbi Bilişim Ana Bilim Dalı
PROF. DR. OSMAN SAKA