RNA dizileme verileri üzerinde boyut indirgeme yöntemlerinin kümeleme analizi performansına etkisinin benzetim çalışması ile değerlendirilmesi

Evaluation of the effect of dimension reduction methods on clustering analysis performance on RNA sequencing data with a simulation study

PDF İndir

Tez No: 903660
Yazar: ÇAĞLA ŞAFAK
Danışmanlar: DOÇ. DR. BEYZA DOĞANAY
Tez Türü: Doktora
Konular: Biyoistatistik, Biostatistics
Anahtar Kelimeler: Belirtilmemiş.
Yıl: 2024
Dil: Türkçe
Üniversite: Ankara Üniversitesi
Enstitü: Sağlık Bilimleri Enstitüsü
Ana Bilim Dalı: Biyoistatistik Ana Bilim Dalı
Bilim Dalı: Belirtilmemiş.
Sayfa Sayısı: 88

Özet

Boyut İndirgeme, verinin yüksek boyutlu temsilinin önemli bilgileri kaybetmeden düşük boyutlu bir temsile dönüştürülmesidir. Böylece, veriler minimum bilgi kaybı ile anlamlı ve daha düşük boyutlu hale dönüşmüş olurlar. Bu durum, yüksek boyutlu verilerin altta yatan yapısının daha iyi anlaşılmasına, yorumlanması ve görselleştirilmesi zor olan durumdan, daha anlamlı bir temsili ortaya çıkmasına olanak tanımaktadır. Kümeleme Analizi, veri setindeki nesneleri farklı gruplara bölmek suretiyle iki nesnenin aynı kümeden olduğu durumlarda birbirlerine benzer olduğu, farklı kümelerden iki nesnenin ise farklı olduğu şeklinde tanımlanabilir. Yani, veriyi benzer nesnelerin gruplarına göre ayırmaktır. Genellikle verideki gizli desenlerin keşfedildiği denetimsiz bir yöntemdir. Bu tez çalışmasında 48 farklı senaryo ile türetilen RNA Dizileme verileri üzerinde TBA, ÇBÖ, BBA, t-SNE ve Isomap boyut indirgeme yöntemleri uygulandıktan sonra, K-Ortalamalar ve Hiyerarşik Kümeleme yöntemlerinin, kümeleme performansları Silüet Katsayıları ile incelenmiştir.

Özet (Çeviri)

Dimension Reduction is the process of transforming a high-dimensional representation of data into a low-dimensional one while preserving important information. Thus, the data is transformed into a meaningful and low-dimensional form with minimal loss. This makes it easier to understand, interpret, and visualize the underlying structure of high-dimensional data, which can be difficult to do with a high-dimensional and complex representation. Cluster Analysis is a data analysis technique that involves dividing the objects in a data set into different groups such that two objects in the same cluster are similar to each other, while two objects from different clusters are different. It is an unsupervised learning technique, meaning there are no predefined labels or classes for the data. Generally, the method attempts to discover the natural groupings within the data. In this thesis, after applying dimensional reduction methods such as PCA, MDS, ICA, t-SNE, and Isomap on RNA Sequencing data derived from 48 different scenarios, the clustering performances of K-Means and Hierarchical Clustering methods were examined using Silhouette Coefficients.

Benzer Tezler

Tez No
887096
Phylogeography of the Savi's pipistrelle (Vespertilionidae, chiroptera) complex based on whole mitochondrial genome analysis
Savi'nin cüce yarasası kompleksinin (Vespetilionidae, chiroptera) filocoğrafyasının tüm mitokondriyal genom ile analizi
YELİZ ERGÖL
Yüksek Lisans
İngilizce
2024
Biyoloji İstanbul Teknik Üniversitesi
İklim ve Deniz Bilimleri Ana Bilim Dalı
DR. ÖĞR. ÜYESİ EMRAH ÇORAMAN
Tez No
863656
Comparative evaluation of prokaryotic community of salda lake using oxford nanopore-minion and next generation sequencing-illumina
Salda gölü'nün prokaryotik topluluğunun oxford nanopore-minıon ve yeni nesil dizileme-illumina ile karşılaştırmalı olarak değerlendirilmesi
KÜBRA DOYMUŞ
Yüksek Lisans
İngilizce
2024
Biyoteknoloji İstanbul Teknik Üniversitesi
Çevre Mühendisliği Ana Bilim Dalı
PROF. DR. ORHAN İNCE
Tez No
808589
Particle detection and signal analysis in nanopores
Nanogözeneklerde parçacık algılama ve sinyal analizi
DÜRDANE YILMAZ
Doktora
İngilizce
2023
Biyokimya İstanbul Medeniyet Üniversitesi
Nanobilim ve Nanomühendislik Ana Bilim Dalı
DOÇ. DR. ALİ DİNLER
DOÇ. DR. KAAN KEÇECİ
Tez No
459190
Identification of breast cancer sub-types by using machine learning techniques
Makine öğrenmesi teknikleri kullanarak göğüs kanseri alt türlerinin tespit edilmesi
YUNUS BURAKGAZİ
Yüksek Lisans
İngilizce
2017
Biyoistatistik Dokuz Eylül Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. ZERRİN IŞIK
Tez No
568561
Transkriptom veri seti üzerinde derin öğrenme yöntemi ile klasik veri madenciliği yöntemlerinin sınıflama performanslarının karşılaştırılması
Comparison of classification performance for deep learning method and classical data mining methods on transcriptome data set
MERVE KAŞIKCI
Yüksek Lisans
Türkçe
2019
Biyoistatistik Hacettepe Üniversitesi
Biyoistatistik Ana Bilim Dalı
PROF. DR. ERDEM KARABULUT

Geri Dön