Transkriptom veri seti üzerinde derin öğrenme yöntemi ile klasik veri madenciliği yöntemlerinin sınıflama performanslarının karşılaştırılması

Comparison of classification performance for deep learning method and classical data mining methods on transcriptome data set

PDF İndir

Tez No: 568561
Yazar: MERVE KAŞIKCI
Danışmanlar: PROF. DR. ERDEM KARABULUT
Tez Türü: Yüksek Lisans
Konular: Biyoistatistik, Biostatistics
Anahtar Kelimeler: RNA dizileme, kanser, veri madenciliği, sınıflama yöntemleri, Derin Öğrenme, RNA sequencing, cancer, data mining, classification methods, Deep Learning
Yıl: 2019
Dil: Türkçe
Üniversite: Hacettepe Üniversitesi
Enstitü: Sağlık Bilimleri Enstitüsü
Ana Bilim Dalı: Biyoistatistik Ana Bilim Dalı
Bilim Dalı: Belirtilmemiş.
Sayfa Sayısı: 80

Özet

Bu tez çalışmasında akciğer kanseri ve böbrek kanserine ait RNA dizileme verileri kullanılarak, kanser alt türlerinin sınıflandırılmasında klasik veri madenciliği yöntemleri ve Derin Öğrenme yöntemi kullanılmış, sınıflama performansları karşılaştırılmıştır. Çalışmada kullanılan klasik veri madenciliği yöntemleri Yapay Sinir Ağları, Rastgele Orman ve Destek Vektör Makineleri'dir. Akciğer kanseri veri seti iki sınıflı ve sınıf dağılımları dengeli bir veri seti iken böbrek kanseri veri setinde üç sınıf vardır, sınıflardaki gözlem sayıları dengesizdir. Sınıflamada kullanılan gen setleri, farklı filtreler uygulanarak elde edilmiştir. Böylece, farklı özellikte veri setlerinde ve farklı filtrelerde sınıflama yöntemlerinin performansları incelenmiştir. Her sınıflama yöntemi için, parametrelerin alabileceği değer aralıkları belirlenmiş ve eğitim setleri üzerinde denenerek en uygun parametreler seçilmiştir. Çalışmada kullanılan veri setlerinde, klasik veri madenciliği yöntemlerine göre daha derin bir yapıya sahip olan Derin Öğrenme yöntemi başarılı bir performans göstermiştir.

Özet (Çeviri)

In this thesis, Artificial Neural Networks, Random Forest, Support Vector Machines, which are classical data mining methods, and Deep Learning method were used to classify the cancer subtypes. The performances of these methods were compared. For this reason, two different RNA sequencing data sets were used. The first data set is the lung cancer data set which has two classes. It is a balanced data set in terms of class size. The other data set is the renal cancer data set. This data set contains three classes and the number of observation in these classes are uneven. Gene sets used in the classification were obtained by using different filters. Therefore the performances of the classification methods in different data sets and filters were examined. For each classification method, specific parameters were optimized and the most appropriate parameters were selected. Deep Learning method which has a deeper structure compared to classical data mining methods, showed a successful performance on the data sets used in this study.

Benzer Tezler

Tez No
887071
A deep learning architecture for missing metabolite concentration prediction
Eksik metabolit miktarı tahmini için bir derin öğrenme mimarisi
SADİ ÇELİK
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol İstanbul Teknik Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. ALİ ÇAKMAK
Tez No
668125
A pan-cancer study using TCGA datasets to find possible novel prognostic markers
Yeni olası prognostik belirteçlerin bulunması amacıyla TCGA veri setleri kullanılarak yapılan bir pan-kanser çalışması
BATUHAN KISAKOL
Yüksek Lisans
İngilizce
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Marmara Üniversitesi
Veri Bilimi Ana Bilim Dalı
DR. MEHMET BAYSAN
Tez No
914696
COVİD-19 tanısında konvolüsyonel sinir ağları mimarilerinin karşılaştırılması
Comparison of convolutional neural network architectures in the diagnosis of COVİD-19
IŞIL ÜNALDI
Doktora
Türkçe
2024
Biyoistatistik Ondokuz Mayıs Üniversitesi
Biyoistatistik ve Tıp Bilişimi Ana Bilim Dalı
PROF. DR. LEMAN TOMAK
Tez No
730006
Ankilozan spondilit hastalığının moleküler mekanizmasının çoklu-omik verilerin entegre analizi ile incelenmesi
Investigation of molecular mechanism of ankylosing spondylitis by multi-omics data integration
KEREM UZALA
Yüksek Lisans
Türkçe
2022
Biyoloji İstanbul Medeniyet Üniversitesi
Biyolojik Veri Bilimi Ana Bilim Dalı
DR. ÖĞR. ÜYESİ MUHAMMED ERKAN KARABEKMEZ
Tez No
920468
Identification of tumor-discriminating mRNA signatures via support vector machines supported by disease ontology
Destek vektör makineleri kullanılarak hastalık ontolojisi aracılığıyla tümör ayırımını sağlayan mRNA imza moleküllerinin tanımlanması
MUSTAFA ERHAN ÖZER
Doktora
İngilizce
2024
Biyoistatistik Marmara Üniversitesi
Biyomühendislik Ana Bilim Dalı
PROF. DR. KAZIM YALÇIN ARGA
PROF. DR. PEMRA ÖZBEK SARICA

Geri Dön