RNA dizileme verileri üzerinde boyut indirgeme yöntemlerinin kümeleme analizi performansına etkisinin benzetim çalışması ile değerlendirilmesi
Evaluation of the effect of dimension reduction methods on clustering analysis performance on RNA sequencing data with a simulation study
- Tez No: 903660
- Danışmanlar: DOÇ. DR. BEYZA DOĞANAY
- Tez Türü: Doktora
- Konular: Biyoistatistik, Biostatistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: Türkçe
- Üniversite: Ankara Üniversitesi
- Enstitü: Sağlık Bilimleri Enstitüsü
- Ana Bilim Dalı: Biyoistatistik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 88
Özet
Boyut İndirgeme, verinin yüksek boyutlu temsilinin önemli bilgileri kaybetmeden düşük boyutlu bir temsile dönüştürülmesidir. Böylece, veriler minimum bilgi kaybı ile anlamlı ve daha düşük boyutlu hale dönüşmüş olurlar. Bu durum, yüksek boyutlu verilerin altta yatan yapısının daha iyi anlaşılmasına, yorumlanması ve görselleştirilmesi zor olan durumdan, daha anlamlı bir temsili ortaya çıkmasına olanak tanımaktadır. Kümeleme Analizi, veri setindeki nesneleri farklı gruplara bölmek suretiyle iki nesnenin aynı kümeden olduğu durumlarda birbirlerine benzer olduğu, farklı kümelerden iki nesnenin ise farklı olduğu şeklinde tanımlanabilir. Yani, veriyi benzer nesnelerin gruplarına göre ayırmaktır. Genellikle verideki gizli desenlerin keşfedildiği denetimsiz bir yöntemdir. Bu tez çalışmasında 48 farklı senaryo ile türetilen RNA Dizileme verileri üzerinde TBA, ÇBÖ, BBA, t-SNE ve Isomap boyut indirgeme yöntemleri uygulandıktan sonra, K-Ortalamalar ve Hiyerarşik Kümeleme yöntemlerinin, kümeleme performansları Silüet Katsayıları ile incelenmiştir.
Özet (Çeviri)
Dimension Reduction is the process of transforming a high-dimensional representation of data into a low-dimensional one while preserving important information. Thus, the data is transformed into a meaningful and low-dimensional form with minimal loss. This makes it easier to understand, interpret, and visualize the underlying structure of high-dimensional data, which can be difficult to do with a high-dimensional and complex representation. Cluster Analysis is a data analysis technique that involves dividing the objects in a data set into different groups such that two objects in the same cluster are similar to each other, while two objects from different clusters are different. It is an unsupervised learning technique, meaning there are no predefined labels or classes for the data. Generally, the method attempts to discover the natural groupings within the data. In this thesis, after applying dimensional reduction methods such as PCA, MDS, ICA, t-SNE, and Isomap on RNA Sequencing data derived from 48 different scenarios, the clustering performances of K-Means and Hierarchical Clustering methods were examined using Silhouette Coefficients.
Benzer Tezler
- Phylogeography of the Savi's pipistrelle (Vespertilionidae, chiroptera) complex based on whole mitochondrial genome analysis
Savi'nin cüce yarasası kompleksinin (Vespetilionidae, chiroptera) filocoğrafyasının tüm mitokondriyal genom ile analizi
YELİZ ERGÖL
Yüksek Lisans
İngilizce
2024
Biyolojiİstanbul Teknik Üniversitesiİklim ve Deniz Bilimleri Ana Bilim Dalı
DR. ÖĞR. ÜYESİ EMRAH ÇORAMAN
- Comparative evaluation of prokaryotic community of salda lake using oxford nanopore-minion and next generation sequencing-illumina
Salda gölü'nün prokaryotik topluluğunun oxford nanopore-minıon ve yeni nesil dizileme-illumina ile karşılaştırmalı olarak değerlendirilmesi
KÜBRA DOYMUŞ
Yüksek Lisans
İngilizce
2024
Biyoteknolojiİstanbul Teknik ÜniversitesiÇevre Mühendisliği Ana Bilim Dalı
PROF. DR. ORHAN İNCE
- Particle detection and signal analysis in nanopores
Nanogözeneklerde parçacık algılama ve sinyal analizi
DÜRDANE YILMAZ
Doktora
İngilizce
2023
Biyokimyaİstanbul Medeniyet ÜniversitesiNanobilim ve Nanomühendislik Ana Bilim Dalı
DOÇ. DR. ALİ DİNLER
DOÇ. DR. KAAN KEÇECİ
- Identification of breast cancer sub-types by using machine learning techniques
Makine öğrenmesi teknikleri kullanarak göğüs kanseri alt türlerinin tespit edilmesi
YUNUS BURAKGAZİ
Yüksek Lisans
İngilizce
2017
BiyoistatistikDokuz Eylül ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. ZERRİN IŞIK
- Transkriptom veri seti üzerinde derin öğrenme yöntemi ile klasik veri madenciliği yöntemlerinin sınıflama performanslarının karşılaştırılması
Comparison of classification performance for deep learning method and classical data mining methods on transcriptome data set
MERVE KAŞIKCI
Yüksek Lisans
Türkçe
2019
BiyoistatistikHacettepe ÜniversitesiBiyoistatistik Ana Bilim Dalı
PROF. DR. ERDEM KARABULUT