Gen ifadesi zaman serisi verileri için hizalama algoritmaları
Alignment algorithms for gene expression time series data
- Tez No: 494611
- Danışmanlar: YRD. DOÇ. DR. ASLI SUNER KARAKÜLAH
- Tez Türü: Yüksek Lisans
- Konular: Biyoistatistik, Biostatistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2018
- Dil: Türkçe
- Üniversite: Ege Üniversitesi
- Enstitü: Sağlık Bilimleri Enstitüsü
- Ana Bilim Dalı: Biyoistatistik ve Tıbbi Bilişim Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 78
Özet
Biyolojik bir sürece ait gen ifadesi zaman serilerinin örnekleme zamanları veya ilerleme hızları farklı koşullarda veya bireylerde değişebilmektedir. Bu nedenle zaman serilerinin uygun bir şekilde karşılaştırması, kümelenmesi ve sınıflandırılması gibi problemlerde genellikle serilerin hizalanması gerekmektedir. Bu çalışmada, gen ifadesi zaman serilerinin hizalanmasında kullanılan çeşitli metodolojik yaklaşımlara genel bir bakışın sunulması ve literatürde başlıca kullanılan algoritmaların ayrıntılı olarak incelenmesi amaçlanmıştır. Ayrıca yaygın olarak kullanılan dinamik zaman bükmesi algoritması, insan ve fare akciğer gelişim sürecine uygulanarak bu iki süreç arasındaki benzerlik ve farklılıkların ortaya konulması hedeflenmiştir. İlk olarak, hizalama algoritmalarını gen ifadesi zaman serilerine uygulamadan önce; modelleme, gen seçimi ve gürültü giderme gibi ön işleme adımlarına neden ihtiyaç duyulduğu açıklanmış ve her bir ön işleme adımına ait literatürde kullanılan yaklaşımlar özetlenmiştir. Ardından gen ifadesi zaman serileri için geliştirilmiş olan hizalama algoritmaları; dinamik zaman bükmesi, parametrik zaman bükmesi, üretici zaman bükmesi ve korelasyon zaman bükmesi algoritmaları ayrıntılı olarak anlatılmıştır. Son olarak, bu hizalama algoritmalarının performansları, uygulama alanlarındaki etkinlikleri ve yapılarından kaynaklanan kısıtlılıkları değerlendirilmiştir. Tezin uygulama kısmında ise, insan ve fare fetal akciğer gelişimine ait zamansal farklar, dinamik zaman bükmesi algoritmasıyla tahminlenmiş ve bir simülasyon prosedürü yardımıyla bu farkların istatistiksel olarak anlamlılığı değerlendirilmiştir. Gen ifadesi zaman serilerinin hizalanmasında kullanılan algoritmalar, değişik hızlarda seyreden biyolojik olaylardaki benzerliklerin ve farklılıkların genom düzeyinde aydınlatılmasında büyük kolaylıklar sağlamaktadır.
Özet (Çeviri)
The sampling time or rate of progress of gene expression time series belonging to a biological process can vary in different conditions or in individuals. Therefore, the series need to be aligned with alignment algorithms special to gene expression time course data before comparison, classification and clustering tasks. In this study, it is aimed to present a general overview of the different approaches used in aligning gene expression time series data, and to apply a commonly used algorithm by using human and mouse fetal lung development data. First of all, gene selection criteria before the alignment and, mathematical and statistical modeling approaches for handling missing data, irregular sampling and sparseness of gene expression time series data problems have been discussed. Then, the use of dynamic time warping algorithm that is widely used in different research areas such as speech recognition, data mining and information retrieval to aligning gene expression data has been examined. After discussion about dynamic time warping algorithm other developed methods such as parametric time warping, multi segment generative time warping and shorting correlation optimized time warping algorithms have been summarized with their modeling approaches. B-splines, its coefficients estimated via linear mixed effect model, have been constructed for the time series in pre-processing step of parametric time warping; and smoothing B-splines have been used for the last two methods. Finally, the performance of these alignment algorithms, their effectiveness according to application areas, and their limitations were evaluated. In application section of this thesis, time shifts between mouse and human fetal lung development have been estimated with dynamic time warping algorithm, and statistical significance of these shifts has been determined via a simulation procedure. The algorithms used to align the gene expression time series provide great ease in bring out the similarities and differences in the biological events in different speeds at the genome level.
Benzer Tezler
- An efficient evolutionary clustering and prediction model for gene expression time series data
Gen ifadesi zaman serisi verileri için etkin bir evrimsel kümeleme ve öngörü modeli
ATAKAN ERDEM
Doktora
İngilizce
2014
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. TAFLAN İMRE GÜNDEM
- Identifying gene regulatory communities from microarray time-series expression profiles using hidden Markov models
Düzenleyici gen topluluklarının saklı Markov modelleri kullanılarak zaman serisi mikrodizi ekspresyon profillerinden belirlenmensi
OSMAN MAHMUT ERYURT
Yüksek Lisans
İngilizce
2011
BiyoistatistikKoç ÜniversitesiHesaplamalı Bilimler ve Mühendislik Ana Bilim Dalı
DOÇ. DR. ENGİN ERZİN
PROF. DR. ATTİLA GÜRSOY
- Time series classification with support vector machine and data augmentation
Destek vektör makinesi ve veri büyütme ile zaman serileri sınıflandırması
ESMA BİRİŞÇİ
Yüksek Lisans
İngilizce
2011
İstatistikUniversity of Missouriİstatistik ve Bilgisayar Bilimleri Ana Bilim Dalı
PROF. DR. SOUNAK CHAKRABORTY
- A Bayesian approach to the clustering problem with application to gene expression analysis
Öbekleme problemine Bayesci bir yaklaşım ve gen ifadesi analizinde uygulanması
IŞIK BARIŞ FİDANER
Doktora
İngilizce
2016
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. ALİ TAYLAN CEMGİL
- Setd3-dependent gene expression changes during endoderm differentiation of mouse embryonic stem cells
Fare embriyonik kök hücrelerinin endoderme farklılaşması sırasında setd3 proteinine bağımlı gen ifadesi değişimleri
EMRE BALBAŞI
Yüksek Lisans
İngilizce
2022
BiyolojiOrta Doğu Teknik ÜniversitesiBiyoloji Ana Bilim Dalı
DR. ÖĞR. ÜYESİ NİHAL TERZİ ÇİZMECİOĞLU