Boruta ve Elastik Ağ Algoritmalarının Gen Seçim Performanslarının RNA Dizileme Veri Setleri Üzerinde Karşılaştırılması: Bir Monte Carlo Benzetim Çalışması
Comparison of Gene Selection Performances of Boruta and Elastic Net Algorithms on RNA Sequencing Data: A Monte Carlo Simulation Study
- Tez No: 817127
- Danışmanlar: DOÇ. DR. OSMAN DAĞ
- Tez Türü: Yüksek Lisans
- Konular: Biyoistatistik, Biostatistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: Türkçe
- Üniversite: Hacettepe Üniversitesi
- Enstitü: Sağlık Bilimleri Enstitüsü
- Ana Bilim Dalı: Biyoistatistik Ana Bilim Dalı
- Bilim Dalı: Biyoistatistik Bilim Dalı
- Sayfa Sayısı: 59
Özet
Kanser Genom Atlası Programından elde edilen farklı kanser türlerine ait sekiz gerçek RNA dizileme veri seti kullanılarak ilgili kanser hastalığına önemli derecede etki eden genlerin seçilmesinde, Boruta Algoritması ve Elastik Ağ Genelleştirilmiş Doğrusal Modeller İçerisinde Determan'ın Algoritması uygulanmıştır. Boruta Algoritmasının kendi içerisinde bulunan, sınıflandırma yöntemlerine ve önemlilik ölçütlerine göre farklılaşan yöntemlerden yedi tanesine ait algoritmalar, ayrı ayrı olarak uygulanmış ve elde edilen sonuçlar sadece Elastik Ağ Algoritması ile değil aynı zamanda birbirleri ile de kıyaslanmıştır. Gerçek veri setlerine dayalı olarak bir Monte Carlo benzetim çalışması yapılmıştır. Özellik seçiminde kullanılan gen setleri; filtreleme, normalleştirme, dönüşüm ve tek değişkenli analiz olmak üzere dört aşamada ön işleme adımları uygulanarak elde edilmiştir. Özellik seçimi yöntemlerinin performansları Pozitif Kestirim Değeri, Duyarlılık, F1 Ölçüsü gibi ölçüler kullanılarak karşılaştırılmıştır. Çalışmada kullanılan veri setlerinin tümünde Elastik Ağ Algoritması, Pozitif Kestirim Değeri açısından öne çıkmıştır. Boruta Algoritmasının Ekstra Ağaçlar ve Random Ferns tabanlı yöntemleri, Duyarlılık Oranları açısından Elastik Ağ Algoritmasından daha iyi performans göstermiştir.
Özet (Çeviri)
Boruta Algorithm and Determan's Algorithm in Elastic Net Generalized Linear Models were applied to select the genes that have a significant effect on the related cancer disease using eight real RNA sequencing data set belonging to different cancer types obtained from the Cancer Genome Atlas Program. Algorithms belonging to seven of the methods within the Boruta Algorithm, which differ according to different classification methods and various importance criteria, were applied separately and the results obtained were compared not only with the Elastic Network Algorithm but also with each other. A Monte Carlo simulation study was performed based on the real data sets. The gene sets used for feature selection were obtained by applying preprocessing steps in four stages: filtering, normalization, transformation and univariate analysis. The performances of the feature selection methods were compared using measures such as Precision, Recall and F1 Measure. For all of the data sets used in the study, Elastic Net Algorithm stood out in terms of Precision. Boruta Algorithm based on Extra Trees and Random Ferns outperformed the Elastic Net Algorithm in terms of Recall.
Benzer Tezler
- Polimer yapı içerisinde sentezlenen ZnO nanoparçacıklarının spektroskopik ve fiziksel özelliklerinin incelenmesi
Investigating spectroscopic and physical properties of ZnO nanoparticles sythesized in polymer structure
NESRİN ÇELEBİOĞLU
Doktora
Türkçe
2016
Fizik ve Fizik Mühendisliğiİstanbul Teknik ÜniversitesiFizik Mühendisliği Ana Bilim Dalı
PROF. DR. YAŞAR YILMAZ
- Analytical and numerical analysis of coupled linear vibrations of fgm beams and frames
Fgm kiriş ve çerçevelerin bağlı lineer titreşimlerinin analitik ve sayısal analizi
NEDİMCAN AYTEMÜR
Yüksek Lisans
İngilizce
2022
Makine Mühendisliğiİstanbul Teknik ÜniversitesiMakine Mühendisliği Ana Bilim Dalı
PROF. DR. EKREM TÜFEKCİ
DR. ÖĞR. ÜYESİ UĞURCAN EROĞLU
- Geliştirilmiş kaynak dikişinin patlama performansına etkisi
The effect of improved seam weld on blast performance
KUTAY ÇITIR
Doktora
Türkçe
2022
Makine MühendisliğiEge ÜniversitesiMakine Mühendisliği Ana Bilim Dalı
PROF. DR. HASAN YILDIZ
- A micro-mechanically based modeling of double network hydrogels
Çift ağlı hidrojellerin mikromekanik temelli modellenmesi
İSMAİL DOĞAN KÜLCÜ
Doktora
İngilizce
2016
Makine MühendisliğiRheinisch-Westfälische Technische Hochschule AachenMakine Mühendisliği Ana Bilim Dalı
PROF. DR. MIKHAIL ITSKOV
- An ALE framework for multiphase flows
Çok fazlı akışlar için bir ALE yaklaşımı
ÇAĞATAY GÜVENTÜRK
Doktora
İngilizce
2022
Havacılık Mühendisliğiİstanbul Teknik ÜniversitesiUçak ve Uzay Mühendisliği Ana Bilim Dalı
PROF. DR. MEHMET ŞAHİN