Geri Dön

Transkriptom veri seti üzerinde derin öğrenme yöntemi ile klasik veri madenciliği yöntemlerinin sınıflama performanslarının karşılaştırılması

Comparison of classification performance for deep learning method and classical data mining methods on transcriptome data set

  1. Tez No: 568561
  2. Yazar: MERVE KAŞIKCI
  3. Danışmanlar: PROF. DR. ERDEM KARABULUT
  4. Tez Türü: Yüksek Lisans
  5. Konular: Biyoistatistik, Biostatistics
  6. Anahtar Kelimeler: RNA dizileme, kanser, veri madenciliği, sınıflama yöntemleri, Derin Öğrenme, RNA sequencing, cancer, data mining, classification methods, Deep Learning
  7. Yıl: 2019
  8. Dil: Türkçe
  9. Üniversite: Hacettepe Üniversitesi
  10. Enstitü: Sağlık Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Biyoistatistik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 80

Özet

Bu tez çalışmasında akciğer kanseri ve böbrek kanserine ait RNA dizileme verileri kullanılarak, kanser alt türlerinin sınıflandırılmasında klasik veri madenciliği yöntemleri ve Derin Öğrenme yöntemi kullanılmış, sınıflama performansları karşılaştırılmıştır. Çalışmada kullanılan klasik veri madenciliği yöntemleri Yapay Sinir Ağları, Rastgele Orman ve Destek Vektör Makineleri'dir. Akciğer kanseri veri seti iki sınıflı ve sınıf dağılımları dengeli bir veri seti iken böbrek kanseri veri setinde üç sınıf vardır, sınıflardaki gözlem sayıları dengesizdir. Sınıflamada kullanılan gen setleri, farklı filtreler uygulanarak elde edilmiştir. Böylece, farklı özellikte veri setlerinde ve farklı filtrelerde sınıflama yöntemlerinin performansları incelenmiştir. Her sınıflama yöntemi için, parametrelerin alabileceği değer aralıkları belirlenmiş ve eğitim setleri üzerinde denenerek en uygun parametreler seçilmiştir. Çalışmada kullanılan veri setlerinde, klasik veri madenciliği yöntemlerine göre daha derin bir yapıya sahip olan Derin Öğrenme yöntemi başarılı bir performans göstermiştir.

Özet (Çeviri)

In this thesis, Artificial Neural Networks, Random Forest, Support Vector Machines, which are classical data mining methods, and Deep Learning method were used to classify the cancer subtypes. The performances of these methods were compared. For this reason, two different RNA sequencing data sets were used. The first data set is the lung cancer data set which has two classes. It is a balanced data set in terms of class size. The other data set is the renal cancer data set. This data set contains three classes and the number of observation in these classes are uneven. Gene sets used in the classification were obtained by using different filters. Therefore the performances of the classification methods in different data sets and filters were examined. For each classification method, specific parameters were optimized and the most appropriate parameters were selected. Deep Learning method which has a deeper structure compared to classical data mining methods, showed a successful performance on the data sets used in this study.

Benzer Tezler

  1. A deep learning architecture for missing metabolite concentration prediction

    Eksik metabolit miktarı tahmini için bir derin öğrenme mimarisi

    SADİ ÇELİK

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ALİ ÇAKMAK

  2. A pan-cancer study using TCGA datasets to find possible novel prognostic markers

    Yeni olası prognostik belirteçlerin bulunması amacıyla TCGA veri setleri kullanılarak yapılan bir pan-kanser çalışması

    BATUHAN KISAKOL

    Yüksek Lisans

    İngilizce

    İngilizce

    2020

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMarmara Üniversitesi

    Veri Bilimi Ana Bilim Dalı

    DR. MEHMET BAYSAN

  3. COVİD-19 tanısında konvolüsyonel sinir ağları mimarilerinin karşılaştırılması

    Comparison of convolutional neural network architectures in the diagnosis of COVİD-19

    IŞIL ÜNALDI

    Doktora

    Türkçe

    Türkçe

    2024

    BiyoistatistikOndokuz Mayıs Üniversitesi

    Biyoistatistik ve Tıp Bilişimi Ana Bilim Dalı

    PROF. DR. LEMAN TOMAK

  4. Ankilozan spondilit hastalığının moleküler mekanizmasının çoklu-omik verilerin entegre analizi ile incelenmesi

    Investigation of molecular mechanism of ankylosing spondylitis by multi-omics data integration

    KEREM UZALA

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Biyolojiİstanbul Medeniyet Üniversitesi

    Biyolojik Veri Bilimi Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MUHAMMED ERKAN KARABEKMEZ

  5. Identification of tumor-discriminating mRNA signatures via support vector machines supported by disease ontology

    Destek vektör makineleri kullanılarak hastalık ontolojisi aracılığıyla tümör ayırımını sağlayan mRNA imza moleküllerinin tanımlanması

    MUSTAFA ERHAN ÖZER

    Doktora

    İngilizce

    İngilizce

    2024

    BiyoistatistikMarmara Üniversitesi

    Biyomühendislik Ana Bilim Dalı

    PROF. DR. KAZIM YALÇIN ARGA

    PROF. DR. PEMRA ÖZBEK SARICA