Geri Dön

Gen ifadesi zaman serisi verileri için hizalama algoritmaları

Alignment algorithms for gene expression time series data

  1. Tez No: 494611
  2. Yazar: SEMİHA ÖZGÜL
  3. Danışmanlar: YRD. DOÇ. DR. ASLI SUNER KARAKÜLAH
  4. Tez Türü: Yüksek Lisans
  5. Konular: Biyoistatistik, Biostatistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2018
  8. Dil: Türkçe
  9. Üniversite: Ege Üniversitesi
  10. Enstitü: Sağlık Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Biyoistatistik ve Tıbbi Bilişim Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 78

Özet

Biyolojik bir sürece ait gen ifadesi zaman serilerinin örnekleme zamanları veya ilerleme hızları farklı koşullarda veya bireylerde değişebilmektedir. Bu nedenle zaman serilerinin uygun bir şekilde karşılaştırması, kümelenmesi ve sınıflandırılması gibi problemlerde genellikle serilerin hizalanması gerekmektedir. Bu çalışmada, gen ifadesi zaman serilerinin hizalanmasında kullanılan çeşitli metodolojik yaklaşımlara genel bir bakışın sunulması ve literatürde başlıca kullanılan algoritmaların ayrıntılı olarak incelenmesi amaçlanmıştır. Ayrıca yaygın olarak kullanılan dinamik zaman bükmesi algoritması, insan ve fare akciğer gelişim sürecine uygulanarak bu iki süreç arasındaki benzerlik ve farklılıkların ortaya konulması hedeflenmiştir. İlk olarak, hizalama algoritmalarını gen ifadesi zaman serilerine uygulamadan önce; modelleme, gen seçimi ve gürültü giderme gibi ön işleme adımlarına neden ihtiyaç duyulduğu açıklanmış ve her bir ön işleme adımına ait literatürde kullanılan yaklaşımlar özetlenmiştir. Ardından gen ifadesi zaman serileri için geliştirilmiş olan hizalama algoritmaları; dinamik zaman bükmesi, parametrik zaman bükmesi, üretici zaman bükmesi ve korelasyon zaman bükmesi algoritmaları ayrıntılı olarak anlatılmıştır. Son olarak, bu hizalama algoritmalarının performansları, uygulama alanlarındaki etkinlikleri ve yapılarından kaynaklanan kısıtlılıkları değerlendirilmiştir. Tezin uygulama kısmında ise, insan ve fare fetal akciğer gelişimine ait zamansal farklar, dinamik zaman bükmesi algoritmasıyla tahminlenmiş ve bir simülasyon prosedürü yardımıyla bu farkların istatistiksel olarak anlamlılığı değerlendirilmiştir. Gen ifadesi zaman serilerinin hizalanmasında kullanılan algoritmalar, değişik hızlarda seyreden biyolojik olaylardaki benzerliklerin ve farklılıkların genom düzeyinde aydınlatılmasında büyük kolaylıklar sağlamaktadır.

Özet (Çeviri)

The sampling time or rate of progress of gene expression time series belonging to a biological process can vary in different conditions or in individuals. Therefore, the series need to be aligned with alignment algorithms special to gene expression time course data before comparison, classification and clustering tasks. In this study, it is aimed to present a general overview of the different approaches used in aligning gene expression time series data, and to apply a commonly used algorithm by using human and mouse fetal lung development data. First of all, gene selection criteria before the alignment and, mathematical and statistical modeling approaches for handling missing data, irregular sampling and sparseness of gene expression time series data problems have been discussed. Then, the use of dynamic time warping algorithm that is widely used in different research areas such as speech recognition, data mining and information retrieval to aligning gene expression data has been examined. After discussion about dynamic time warping algorithm other developed methods such as parametric time warping, multi segment generative time warping and shorting correlation optimized time warping algorithms have been summarized with their modeling approaches. B-splines, its coefficients estimated via linear mixed effect model, have been constructed for the time series in pre-processing step of parametric time warping; and smoothing B-splines have been used for the last two methods. Finally, the performance of these alignment algorithms, their effectiveness according to application areas, and their limitations were evaluated. In application section of this thesis, time shifts between mouse and human fetal lung development have been estimated with dynamic time warping algorithm, and statistical significance of these shifts has been determined via a simulation procedure. The algorithms used to align the gene expression time series provide great ease in bring out the similarities and differences in the biological events in different speeds at the genome level.

Benzer Tezler

  1. An efficient evolutionary clustering and prediction model for gene expression time series data

    Gen ifadesi zaman serisi verileri için etkin bir evrimsel kümeleme ve öngörü modeli

    ATAKAN ERDEM

    Doktora

    İngilizce

    İngilizce

    2014

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. TAFLAN İMRE GÜNDEM

  2. Identifying gene regulatory communities from microarray time-series expression profiles using hidden Markov models

    Düzenleyici gen topluluklarının saklı Markov modelleri kullanılarak zaman serisi mikrodizi ekspresyon profillerinden belirlenmensi

    OSMAN MAHMUT ERYURT

    Yüksek Lisans

    İngilizce

    İngilizce

    2011

    BiyoistatistikKoç Üniversitesi

    Hesaplamalı Bilimler ve Mühendislik Ana Bilim Dalı

    DOÇ. DR. ENGİN ERZİN

    PROF. DR. ATTİLA GÜRSOY

  3. Time series classification with support vector machine and data augmentation

    Destek vektör makinesi ve veri büyütme ile zaman serileri sınıflandırması

    ESMA BİRİŞÇİ

    Yüksek Lisans

    İngilizce

    İngilizce

    2011

    İstatistikUniversity of Missouri

    İstatistik ve Bilgisayar Bilimleri Ana Bilim Dalı

    PROF. DR. SOUNAK CHAKRABORTY

  4. A Bayesian approach to the clustering problem with application to gene expression analysis

    Öbekleme problemine Bayesci bir yaklaşım ve gen ifadesi analizinde uygulanması

    IŞIK BARIŞ FİDANER

    Doktora

    İngilizce

    İngilizce

    2016

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ALİ TAYLAN CEMGİL

  5. Setd3-dependent gene expression changes during endoderm differentiation of mouse embryonic stem cells

    Fare embriyonik kök hücrelerinin endoderme farklılaşması sırasında setd3 proteinine bağımlı gen ifadesi değişimleri

    EMRE BALBAŞI

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    BiyolojiOrta Doğu Teknik Üniversitesi

    Biyoloji Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ NİHAL TERZİ ÇİZMECİOĞLU