Geri Dön

RNA dizileme verileri üzerinde boyut indirgeme yöntemlerinin kümeleme analizi performansına etkisinin benzetim çalışması ile değerlendirilmesi

Evaluation of the effect of dimension reduction methods on clustering analysis performance on RNA sequencing data with a simulation study

  1. Tez No: 903660
  2. Yazar: ÇAĞLA ŞAFAK
  3. Danışmanlar: DOÇ. DR. BEYZA DOĞANAY
  4. Tez Türü: Doktora
  5. Konular: Biyoistatistik, Biostatistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: Türkçe
  9. Üniversite: Ankara Üniversitesi
  10. Enstitü: Sağlık Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Biyoistatistik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 88

Özet

Boyut İndirgeme, verinin yüksek boyutlu temsilinin önemli bilgileri kaybetmeden düşük boyutlu bir temsile dönüştürülmesidir. Böylece, veriler minimum bilgi kaybı ile anlamlı ve daha düşük boyutlu hale dönüşmüş olurlar. Bu durum, yüksek boyutlu verilerin altta yatan yapısının daha iyi anlaşılmasına, yorumlanması ve görselleştirilmesi zor olan durumdan, daha anlamlı bir temsili ortaya çıkmasına olanak tanımaktadır. Kümeleme Analizi, veri setindeki nesneleri farklı gruplara bölmek suretiyle iki nesnenin aynı kümeden olduğu durumlarda birbirlerine benzer olduğu, farklı kümelerden iki nesnenin ise farklı olduğu şeklinde tanımlanabilir. Yani, veriyi benzer nesnelerin gruplarına göre ayırmaktır. Genellikle verideki gizli desenlerin keşfedildiği denetimsiz bir yöntemdir. Bu tez çalışmasında 48 farklı senaryo ile türetilen RNA Dizileme verileri üzerinde TBA, ÇBÖ, BBA, t-SNE ve Isomap boyut indirgeme yöntemleri uygulandıktan sonra, K-Ortalamalar ve Hiyerarşik Kümeleme yöntemlerinin, kümeleme performansları Silüet Katsayıları ile incelenmiştir.

Özet (Çeviri)

Dimension Reduction is the process of transforming a high-dimensional representation of data into a low-dimensional one while preserving important information. Thus, the data is transformed into a meaningful and low-dimensional form with minimal loss. This makes it easier to understand, interpret, and visualize the underlying structure of high-dimensional data, which can be difficult to do with a high-dimensional and complex representation. Cluster Analysis is a data analysis technique that involves dividing the objects in a data set into different groups such that two objects in the same cluster are similar to each other, while two objects from different clusters are different. It is an unsupervised learning technique, meaning there are no predefined labels or classes for the data. Generally, the method attempts to discover the natural groupings within the data. In this thesis, after applying dimensional reduction methods such as PCA, MDS, ICA, t-SNE, and Isomap on RNA Sequencing data derived from 48 different scenarios, the clustering performances of K-Means and Hierarchical Clustering methods were examined using Silhouette Coefficients.

Benzer Tezler

  1. Phylogeography of the Savi's pipistrelle (Vespertilionidae, chiroptera) complex based on whole mitochondrial genome analysis

    Savi'nin cüce yarasası kompleksinin (Vespetilionidae, chiroptera) filocoğrafyasının tüm mitokondriyal genom ile analizi

    YELİZ ERGÖL

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Biyolojiİstanbul Teknik Üniversitesi

    İklim ve Deniz Bilimleri Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ EMRAH ÇORAMAN

  2. Comparative evaluation of prokaryotic community of salda lake using oxford nanopore-minion and next generation sequencing-illumina

    Salda gölü'nün prokaryotik topluluğunun oxford nanopore-minıon ve yeni nesil dizileme-illumina ile karşılaştırmalı olarak değerlendirilmesi

    KÜBRA DOYMUŞ

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Biyoteknolojiİstanbul Teknik Üniversitesi

    Çevre Mühendisliği Ana Bilim Dalı

    PROF. DR. ORHAN İNCE

  3. Particle detection and signal analysis in nanopores

    Nanogözeneklerde parçacık algılama ve sinyal analizi

    DÜRDANE YILMAZ

    Doktora

    İngilizce

    İngilizce

    2023

    Biyokimyaİstanbul Medeniyet Üniversitesi

    Nanobilim ve Nanomühendislik Ana Bilim Dalı

    DOÇ. DR. ALİ DİNLER

    DOÇ. DR. KAAN KEÇECİ

  4. Identification of breast cancer sub-types by using machine learning techniques

    Makine öğrenmesi teknikleri kullanarak göğüs kanseri alt türlerinin tespit edilmesi

    YUNUS BURAKGAZİ

    Yüksek Lisans

    İngilizce

    İngilizce

    2017

    BiyoistatistikDokuz Eylül Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. ZERRİN IŞIK

  5. Transkriptom veri seti üzerinde derin öğrenme yöntemi ile klasik veri madenciliği yöntemlerinin sınıflama performanslarının karşılaştırılması

    Comparison of classification performance for deep learning method and classical data mining methods on transcriptome data set

    MERVE KAŞIKCI

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    BiyoistatistikHacettepe Üniversitesi

    Biyoistatistik Ana Bilim Dalı

    PROF. DR. ERDEM KARABULUT