Algorithms for the discovery of large genomic inversions using pooled clone sequencing
Büyük inversiyonların toplanmış klon dizileme yöntemi kullanılarak keşfi için algoritmalar
- Tez No: 395472
- Danışmanlar: YRD. DOÇ. DR. CAN ALKAN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2015
- Dil: İngilizce
- Üniversite: İhsan Doğramacı Bilkent Üniversitesi
- Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
- Sayfa Sayısı: 126
Özet
Genel olarak kopya sayısı varyasyonu (KSV) ve dengeli yeniden düzenlemeler olarak sınıflandırılabilen çok çeşitli genomik yapısal varyasyon tipleri bulunmaktadır. Her ne kadar literatürde KSV'lerin karakterizasyonu için çok sayıda algoritma varsa da, inversiyon ve translokasyon gibi dengeli yeniden düzenlemelerin keşfi henüz açık bir problemdir. Bunun başlıca sebebi, bu tür varyasyonların kırılma noktalarının parçasal duplikasyonlar ve yaygın tekrarlara denk gelmesi, ve bu durumun kısa okumaların güvenilir şekilde hizalandırılmasını zorlaştırmasıdır. 1000 Genom Projesi inversiyonlarin bulunması için bazı metotların geliştirilmesine önayak olduysa da, geliştirilen algoritmalar göreceli olarak kısa inversiyonlarin keşfiyle sınırlıdır, ve büyük inversiyonlarin yeni nesil dizileme (YND) kullanılarak keşfi için halihazırda bir algoritma bulunmamaktadır. Bu çalışmada, daha önce haplotip haritalama için geliştirilmiş olan bir dizileme metotunu (Kitzman vd., 2011) kullanarak büyük inversiyonlarin karakterizasyonunu öneriyoruz. Toplanmış klon dizileme adı verilen bu yöntem, klon tabanlı dizilemenin sağladığı avantajları YND teknolojilerinin hız ve masraf etkinliği ile birleştirmektedir. Bu yöntem ile elde edilmiş verileri kullanarak, dipSeq adında, büyük inversiyonları (>500 Kbp) keşfedebilen bir algoritma geliştirdik. dipSeq algoritmasının gücünü önce simüle edilmiş verilerle ispatlayıp, daha sonra da NA12878 kodlu insan DNA'sından elde edilmiş gerçek veriye uyguladık. Bu genomda daha önceden keşfedilmiş ve deneysel olarak ispatlanmış bütün büyük inversiyonlari bulabildik. Ayrıca önceden bilinmeyen yeni bir inversiyon polimorfizmini de bulup florasan in situ hibridizasyon yöntemi ile tahminimizi doğruladık.
Özet (Çeviri)
An inversion is a chromosomal rearrangement in which an internal segment of a chromosome has been broken twice, flipped 180 degrees, and rejoined. Most known examples of large inversions were found indirectly from studies on human disease where inversions have no detectable effect in parents, but increase the risk of a disease-associated rearrangement in the offspring. The development of a map of inversion polymorphisms will provide valuable information regarding their distribution and frequency in the human genome and will help unravel how inversions and the segmental duplications architecture associated with inverted haplotypes contribute to genomic susceptibility to disease rearrangements. The 1000 Genomes Project spearheaded the development of several methods to identify inversions, however, they are limited to relatively short inversions, and there are currently no available algorithms to discover large inversions using high throughput sequencing technologies (HTS). This is mainly because the breakpoints of such events typically lie within segmental duplications and common repeats, reducing the mappability of short reads. We propose using pooled clone sequencing (PCS), a method originally developed to improve haplotype phasing, to characterize large genomic inversions. PCS merges the advantages of clone based sequencing approaches with the speed and cost efficiency of HTS technologies. Using this sequencing data, we developed a novel algorithm, dipSeq for discovering large inversions (>500 Kbp) following the observation that clones that span the inversion breakpoint will be split into two sections, split clones, when mapped to the reference genome. We evaluate the performance of dipSeq on 3 sets of simulated data, demonstrating its correctness and robustness to structural duplications and other types of structural variations. We further applied dipSeq to the genome of a HapMap individual (NA12878). dipSeq was able to accurately discover all previously known and experimentally validated large inversions. We also identified a new inversion and confirmed using fluorescent in situ hybridization. Although dipSeq displays a relatively high false positive rate using real data, it performed better with simulated data, suggesting that the performance with the NA12878 genome may be improved with higher depth of coverage.
Benzer Tezler
- Developing new approaches for multi-platform and multi-individual genomic sequence assembly
Çoklu platform ve çoklu bireyden elde edilen veriler ile yeni genom birleştirme yaklaşımları geliştirme
PINAR KAVAK
Doktora
İngilizce
2017
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. TUNGA GÜNGÖR
YRD. DOÇ. DR. CAN ALKAN
- Topics in signal processing: Applications in genomics and genetics
Başlık çevirisi yok
ABDÜLKADİR ELMAS
- Efficient machine learning models for cancer biology
Kanser biyolojisi için etkin yapay öğrenme modelleri
AYYÜCE BEGÜM BEKTAŞ
Doktora
İngilizce
2022
Endüstri ve Endüstri MühendisliğiKoç ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. MEHMET GÖNEN
- Whole genome alignment via alternating lyndon factorization tree traversal
Almaşık lyndon faktörizasyon ağacında gezinerek tüm genom hizalama
MAHMUD SAMİ AYDIN
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. CAN ALKAN
- Hierarchical deep bidirectional self-attention model for recommendation
Hiyerarşik çift yönlü öz dikkat tabanlı derin öğrenme tavsiye modeli
İREM İŞLEK
Doktora
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. ŞULE GÜNDÜZ ÖĞÜDÜCÜ