Geri Dön

Clustering of time-course gene expression data with dissimilar replicates

Farklı tekrarlı zaman akışlı gen ifade verilerinin kümelenmesi

  1. Tez No: 338506
  2. Yazar: OZAN ÇINAR
  3. Danışmanlar: DOÇ. DR. ÖZLEM İLK, YRD. DOÇ. DR. CEM İYİGÜN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Genetik, İstatistik, Genetics, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2013
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 132

Özet

Genlerin zaman serisi portrelerinin benzerliklerine göre kümelenmesi biyoenformatik alanında önemli sonuçlara ulaştırmaktadır. Zaman serilerini kümelemek için geliştirilmiş modellemeye dayalı bir çok yöntem bulunmaktadır. Fakat, mikrodizin gen ifade verileri modellemeye yetecek kadar uzun zaman serileri sağlamadığından bu yöntemler elde edilen verilere uygun olmamaktadır. Dahası, kümeleme yöntemlerinde kullanılan uzaklık ölçümleri uzaklığı tek bir nitelikle belirtmekte ve zaman bağımlılığını gözardı etmektedir. Ayrıca, genler farklı tekrarlarda farklı portreler göstererek önemli bilgiler sunabilir. İlginç genleri belirlemek oldukça ağır bilgisayar işlemleri gerektirebilir. Bu çalışmada, her bir geni bir çok tekrardan oluşan kısa zaman serileri olarak kabul eden bir kümeleme yöntemi sunulmuştur. Tekrarlı kısa zaman serileri arasındaki uzaklıklar hem Öklit hem de eğim farklılıklarından gelen bilgilerle ölçülmektedir. Sunulan yaklaşımın portreleri oldukça kısa zamanda ve küçük hatalarla bulduğu sayısal örneklerle gösterilmiştir. Ayrıca, bir çok test yöntemin, farklı tekrarlı veya sabit portreli genleri de ayırt edilebildiğini göstermiştir. Son olarak, küme sayısını tespit edebilmek için farklı yaklaşımlar sunulmuştur. Simulasyon çalışmaları önsel olarak bilinmediğinde küme sayısını bulmada bu yöntemlerin faydalı olduğunu göstermiştir.

Özet (Çeviri)

Clustering the genes with respect to their profile similarity leads to important results in bioinformatics. There are numerous model-based methods to cluster time-series. However, those methods may not be applicable to microarray gene expression data, since they provide short time-series which are not long enough for modeling. Moreover, distance measures used in clustering methods consider the dissimilarities based on only one characteristic and ignore the time-dependencies. Furthermore, genes may show differences among the replications which carry important information. Detecting interesting genes might involve heavy computational burden. In this study, a clustering method is proposed where every gene is accepted as a short time-series with several replications. The distance between the short time-series of replications is measured with the information coming from both the Euclidean distance and the slope distance. The numerical experiments show that the proposed approach can find the clusters very fast with a low percentage of misclassification. Several tests show that the method is also successive in detecting the genes with dissimilar replicates or constant shapes. Finally, different approaches are proposed for determining the number of clusters in a given data set. Simulation studies show that these methods are helpful to detect the number of clusters when it is not known a priori.

Benzer Tezler

  1. Gen ifadesi zaman serisi verileri için hizalama algoritmaları

    Alignment algorithms for gene expression time series data

    SEMİHA ÖZGÜL

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    BiyoistatistikEge Üniversitesi

    Biyoistatistik ve Tıbbi Bilişim Ana Bilim Dalı

    YRD. DOÇ. DR. ASLI SUNER KARAKÜLAH

  2. Hücre kültüründe apoptozun moleküler mekanizmaları üzerine gama radyasyonunun etkileri

    The effects of gamma radiation on molecular mechanisms of apoptosis on cell culture

    WALID KHALILIA

    Doktora

    Türkçe

    Türkçe

    2015

    Biyolojiİstanbul Üniversitesi

    Biyoloji Ana Bilim Dalı

    DOÇ. DR. FATMA GÜL ÖZCAN

  3. Predicting novel small inhibitors of SARS-CoV-2: Targeting SARS-CoV-2 spike protein, human ACE2 protein and SARS-CoV-2 NsP16 via molecular docking

    SARS-CoV-2 için yeni küçük inhibitör moleküllerin tahmini: Moleküler yanaştırma yöntemiyle SARS-CoV-2 spike proteini, insan ACE2 proteini ve SARS-CoV-2 NsP16 hedeflenmesi

    ONUR ÖZER

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Biyolojiİstanbul Teknik Üniversitesi

    Moleküler Biyoloji-Genetik ve Biyoteknoloji Ana Bilim Dalı

    DOÇ. DR. MERT GÜR

    DR. ÖĞR. ÜYESİ SEFER BADAY

  4. Sağlık ve ekonomik gelişme: Türkiye örneği

    Health and economic development: Sample for Turkey

    PELİN GENÇOĞLU

    Doktora

    Türkçe

    Türkçe

    2016

    EkonometriErciyes Üniversitesi

    İktisat Ana Bilim Dalı

    PROF. DR. HAYRİYE ATİK

  5. Yassı alüminyum üretiminde kalite sınıflarının makine öğrenmesi yöntemleri ile tahminlenmesi

    Prediction of quality classification in flat rolled aluminium production using machine learning methods

    ALPEREN AYTATLI

    Doktora

    Türkçe

    Türkçe

    2024

    Endüstri ve Endüstri MühendisliğiSakarya Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ALPER KİRAZ