Clustering of time-course gene expression data with dissimilar replicates
Farklı tekrarlı zaman akışlı gen ifade verilerinin kümelenmesi
- Tez No: 338506
- Danışmanlar: DOÇ. DR. ÖZLEM İLK, YRD. DOÇ. DR. CEM İYİGÜN
- Tez Türü: Yüksek Lisans
- Konular: Genetik, İstatistik, Genetics, Statistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2013
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: İstatistik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 132
Özet
Genlerin zaman serisi portrelerinin benzerliklerine göre kümelenmesi biyoenformatik alanında önemli sonuçlara ulaştırmaktadır. Zaman serilerini kümelemek için geliştirilmiş modellemeye dayalı bir çok yöntem bulunmaktadır. Fakat, mikrodizin gen ifade verileri modellemeye yetecek kadar uzun zaman serileri sağlamadığından bu yöntemler elde edilen verilere uygun olmamaktadır. Dahası, kümeleme yöntemlerinde kullanılan uzaklık ölçümleri uzaklığı tek bir nitelikle belirtmekte ve zaman bağımlılığını gözardı etmektedir. Ayrıca, genler farklı tekrarlarda farklı portreler göstererek önemli bilgiler sunabilir. İlginç genleri belirlemek oldukça ağır bilgisayar işlemleri gerektirebilir. Bu çalışmada, her bir geni bir çok tekrardan oluşan kısa zaman serileri olarak kabul eden bir kümeleme yöntemi sunulmuştur. Tekrarlı kısa zaman serileri arasındaki uzaklıklar hem Öklit hem de eğim farklılıklarından gelen bilgilerle ölçülmektedir. Sunulan yaklaşımın portreleri oldukça kısa zamanda ve küçük hatalarla bulduğu sayısal örneklerle gösterilmiştir. Ayrıca, bir çok test yöntemin, farklı tekrarlı veya sabit portreli genleri de ayırt edilebildiğini göstermiştir. Son olarak, küme sayısını tespit edebilmek için farklı yaklaşımlar sunulmuştur. Simulasyon çalışmaları önsel olarak bilinmediğinde küme sayısını bulmada bu yöntemlerin faydalı olduğunu göstermiştir.
Özet (Çeviri)
Clustering the genes with respect to their profile similarity leads to important results in bioinformatics. There are numerous model-based methods to cluster time-series. However, those methods may not be applicable to microarray gene expression data, since they provide short time-series which are not long enough for modeling. Moreover, distance measures used in clustering methods consider the dissimilarities based on only one characteristic and ignore the time-dependencies. Furthermore, genes may show differences among the replications which carry important information. Detecting interesting genes might involve heavy computational burden. In this study, a clustering method is proposed where every gene is accepted as a short time-series with several replications. The distance between the short time-series of replications is measured with the information coming from both the Euclidean distance and the slope distance. The numerical experiments show that the proposed approach can find the clusters very fast with a low percentage of misclassification. Several tests show that the method is also successive in detecting the genes with dissimilar replicates or constant shapes. Finally, different approaches are proposed for determining the number of clusters in a given data set. Simulation studies show that these methods are helpful to detect the number of clusters when it is not known a priori.
Benzer Tezler
- Gen ifadesi zaman serisi verileri için hizalama algoritmaları
Alignment algorithms for gene expression time series data
SEMİHA ÖZGÜL
Yüksek Lisans
Türkçe
2018
BiyoistatistikEge ÜniversitesiBiyoistatistik ve Tıbbi Bilişim Ana Bilim Dalı
YRD. DOÇ. DR. ASLI SUNER KARAKÜLAH
- Hücre kültüründe apoptozun moleküler mekanizmaları üzerine gama radyasyonunun etkileri
The effects of gamma radiation on molecular mechanisms of apoptosis on cell culture
WALID KHALILIA
- Predicting novel small inhibitors of SARS-CoV-2: Targeting SARS-CoV-2 spike protein, human ACE2 protein and SARS-CoV-2 NsP16 via molecular docking
SARS-CoV-2 için yeni küçük inhibitör moleküllerin tahmini: Moleküler yanaştırma yöntemiyle SARS-CoV-2 spike proteini, insan ACE2 proteini ve SARS-CoV-2 NsP16 hedeflenmesi
ONUR ÖZER
Yüksek Lisans
İngilizce
2022
Biyolojiİstanbul Teknik ÜniversitesiMoleküler Biyoloji-Genetik ve Biyoteknoloji Ana Bilim Dalı
DOÇ. DR. MERT GÜR
DR. ÖĞR. ÜYESİ SEFER BADAY
- Sağlık ve ekonomik gelişme: Türkiye örneği
Health and economic development: Sample for Turkey
PELİN GENÇOĞLU
- Yassı alüminyum üretiminde kalite sınıflarının makine öğrenmesi yöntemleri ile tahminlenmesi
Prediction of quality classification in flat rolled aluminium production using machine learning methods
ALPEREN AYTATLI
Doktora
Türkçe
2024
Endüstri ve Endüstri MühendisliğiSakarya ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. ALPER KİRAZ