Geri Dön

Developing new approaches for multi-platform and multi-individual genomic sequence assembly

Çoklu platform ve çoklu bireyden elde edilen veriler ile yeni genom birleştirme yaklaşımları geliştirme

  1. Tez No: 453587
  2. Yazar: PINAR KAVAK
  3. Danışmanlar: PROF. DR. TUNGA GÜNGÖR, YRD. DOÇ. DR. CAN ALKAN
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Biyomühendislik, Computer Engineering and Computer Science and Control, Bioengineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2017
  8. Dil: İngilizce
  9. Üniversite: Boğaziçi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 122

Özet

Yüksek hacimli dizileme (YHD) teknolojileri büyük ölçüde veriyi düşük maliyete üretiyor, bu durum büyük miktardaki DNA dizisi verisini analiz etmek için algoritma geliştirme araştırmasını hızlandırdı. Bu tezde, genomiks alanında üç bağlantılı probleme yeni çözümler getiriyoruz. İlk olarak, her ne kadar YHD'ye dayalı analizlerin doğruluğu ve tekrarlanabilirliği üzerinde önemli gelişmeler kaydedilse de YHD platformlarının dayanıklılık açısından kullanılabilirliği hala açık soru. Yaygın bir YHD platformunun klinik uygulamalarda kullanılabilirliğini dayanıklılık açısından incelemek için iki bireyin genomlarının tüm genom dizileme verisini iki ayrı merkezde diziledik. YHD platformları ilk-aşama klinik tesler için veri sağlamada çok güçlüler ancak varyant tahminlerinin klinik uygulamalarda kullanılmadan önce ortogonal yöntemlerle doğrulanması gerektiği sonucunu gözlemledik. İkinci olarak genom birleştirme problemi için hala yaratıcı çözümlere ihtiyacımız var. Çok kısa DNA dizilerini -idealde- tüm kromozom dizilerine birleştirmek şu sebeplerden karmaşık bir iş (i) genomların tekrarlı ve kopyalı yapısı (ii) YHD'nin ürettiği verinin kısa ve hatalı olması. Birleştirme doğruluğunu artırmak için üç farklı teknolojiden (Illumina, Ion-Torrent, Roche-454) veri dahil eden yeni bir metod sunuyoruz. Son olarak, ortalama dizi parçacığından uzun yeni dizi insersiyonlarının tanımlanması hala zorlu bir iş. Özellikle yeni dizi insersiyon bulma için geliştirilmiş ve yeniden tüm genom birleştirmesini es geçebilecek az sayıda algoritma var. Tek veya çok genom dizisi verisetlerinde verimli ve doğru bir şekilde yeni dizi insersiyonlarını bulan ve genotipleme yapan yeni bir algoritma Pamir'i sunuyoruz.

Özet (Çeviri)

High throughput sequencing (HTS) technologies generate huge amount of data with very low cost, which prompted research on algorithm development to analyze large DNA sequence datasets. In this thesis, we propose new solutions to three related problems in genomics field. Firstly, although the accuracy and reproducibility of HTS based analyses is highly improved, the usability of these platforms in terms of robustness is still an open question. We produced whole genome shotgun (WGS) sequence data from the genomes of two individuals in two different centers to assess the usability of a widely used HTS platform in terms of robustness in clinical applications. We observe that HTS platforms are powerful enough for providing data for first-pass clinical tests, but before using in clinical applications, the variant predictions need to be confirmed by orthogonal methods. Secondly, we still need innovative methods for the de novo genome assembly problem. The task of assembling very short DNA sequence reads into -ideally- complete chromosome sequences is further complicated due to (i) the repetitive and duplicated structure of genomes, and (ii) the fact that the data produced by the HTS technologies tend to be short and error prone. We present a new method to increase the assembly accuracy by integrating data from Illumina, Ion-Torrent and Roche-454 platforms. Lastly, characterization of novel sequence insertions longer than the average read length remains a challenging task. There are only a few algorithms that are specifically developed for novel sequence insertion discovery that can bypass the need for the whole genome de novo assembly. We present a new algorithm, Pamir, to efficiently and accurately discover and genotype novel sequence insertions using either single or multiple genome sequencing datasets.

Benzer Tezler

  1. Çoklu etmen ortamında nesne tabanlı dağıtık bellek paylaşımı

    Distributed object sharing in the multi-agent environment

    METEHAN PATACI

    Yüksek Lisans

    Türkçe

    Türkçe

    2014

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. NADİA ERDOĞAN

  2. Application framework for supporting performance isolation in software as a service systems

    Bulut mimarili ve performans yalıtımı sağlayan yazılım geliştirme platformu

    ORHUN ALP ORAL

    Yüksek Lisans

    İngilizce

    İngilizce

    2015

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. BEDİR TEKİNERDOĞAN

  3. Exploring opinions of corporate instructional designers on their professional development and training needs

    Kurumsal öğretim tasarımcılarının mesleki gelişim ve eğitim ihtiyaçları konusundaki görüşlerinin araştırılması

    NAZLI GÖKALP

    Yüksek Lisans

    İngilizce

    İngilizce

    2025

    Eğitim ve ÖğretimOrta Doğu Teknik Üniversitesi

    Eğitim Programları ve Öğretimi Ana Bilim Dalı

    DR. ELİF ÖZTÜRK

  4. Sigortada dağıtım ve tutundurma metodları

    Başlık çevirisi yok

    BANU GÖNENÇ

    Yüksek Lisans

    Türkçe

    Türkçe

    1994

    SigortacılıkMarmara Üniversitesi

    Sigortacılık Ana Bilim Dalı

    DOÇ. DR. OSMAN GÜRBÜZ

  5. Uzaktan algılama verileriyle orman yangını analizi

    Forest fire analysis with remote sensing data

    COŞKUN ÖZKAN

    Yüksek Lisans

    Türkçe

    Türkçe

    1998

    Jeodezi ve Fotogrametriİstanbul Teknik Üniversitesi

    Jeodezi ve Fotogrametri Mühendisliği Ana Bilim Dalı

    DOÇ. DR. FİLİZ SUNAR