Large structural variation discovery using long reads with several degrees of error
Farklı hata oranlarına sahip uzun okumalar ile büyük yapısal varyasyon tespiti
- Tez No: 657869
- Danışmanlar: DR. ÖĞR. ÜYESİ CAN ALKAN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2020
- Dil: İngilizce
- Üniversite: İhsan Doğramacı Bilkent Üniversitesi
- Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 58
Özet
Genetik yapısal varyasyonlar (YV) kısaca DNA'nın içerik, kopya ve düzenindeki büyük çaplı değişikliklerdir. Her ne kadar yüksek çıktılı dizileme (YÇD) kullanılmaya başlandıktan sonra ciddi oranda aşama kaydedildiyse de, kırılma noktalarındaki dizi karmaşıklığı kompleks YV ve dengeli yeniden-düzenlenmelerin doğru tespiti muamması güçlüğünü sürdürmektedir. Yakın zamana kadar, okumalar kısa olduğunda bahsi geçen bölgelerdeki okuma hizalamasının zorluğu ve uzun okuma platformlarının yüksek hata oranları YV keşfi sürecindeki problemlerin temelini oluşturmaktaydı. Ancak, Pacific Biosciences şirketinin, $>99\%$ doğruluk payı ve $10-20$ kbps uzunlukta okuma yapabilen High Fidelity (Yüksek Doğrulukta, HiFi) dizileme metodunun ortaya çıkmasıyla, etkili YV keşfi ve kırılma noktası çözünürlüğünün iyileştirilmesi mümkün olmuştur. Biz bu çalışmayla uzun okuma teknolojileri kullanarak yüksek kırılma noktası çözünürlüğüne sahip büyük yapısal varyasyon keşfi yapan özgün bir algoritma olan DALEK'i sunuyoruz. DALEK, uzun okumalardaki ayrık dizi ve dizi derinliği sinyalleri kullanarak büyük (>10 kbps) silinme, inversiyon ve kesitsel duplikasyonları keşfetmektedir. Ayrıca algoritmanın parametrelerine göre hali hazırda yüksek hatalı olan Oxford Nanopore Technologies uzun okumalarından da YV tespiti yapabilmektedir.
Özet (Çeviri)
Genomic structural variations (SVs) are briefly defined as large-scale alterations of DNA content, copy, and organization. Although significant progress has been made since the introduction of high throughput sequencing (HTS) in characterizing SVs, accurate detection of complex SVs and balanced rearrangements still remains elusive due to the sequence complexity at the breakpoints. Until very recently, the difficulty of read mapping in such regions when the reads were short and the high error rates of long read platforms kept the problem challenging. However, with the introduction of the Pacific Biosciences' High Fidelity (HiFi) sequencing methodology, powerful SV detection and breakpoint resolution became possible as a result of its capability to produce highly accurate (>99) long reads (10-20 kbps). Here, we introduce DALEK, a novel algorithm that aims to use long-read technologies to discover large structural variations with high break-point resolution. DALEK uses split read and read depth signatures from long read data to discover large (>10 kbps) deletions, inversions and segmental duplications. We also develop methods to detect large SVs in existing high-error Oxford Nanopore Technologies data.
Benzer Tezler
- Characterization of large structural variation using linked-reads
Büyük yapısal varyasyonların bağlı okumalar kullanılarak karakterize edilmesi
FATİH KARAOĞLANOĞLU
Yüksek Lisans
İngilizce
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. CAN ALKAN
- Prediction of PDZ interactions and classifications using structures and machine learning methods
Yapısal özellikler ve makine öğrenme metodaları kullanarak PDZ domain etkileşimlerini ve sınıfını tahmin etme
TAYFUN TÜMKAYA
Yüksek Lisans
İngilizce
2014
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKoç ÜniversitesiBilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
PROF. DR. ZEHRA ÖZLEM KESKİN ÖZKAYA
PROF. DR. ATTİLA GÜRSOY
- Üretim esnekliğinin endüstriyel satın alma süreci üzerindeki etkisinin incelenmesi ve tamamlayıcı model önerisi
Examining the effect of production flexibility on the industrial buying process and suggesting a supplementary model
SEDAT AYDIN
- Türkiye üzerinde rüzgar şiddetinin ekstrem değer analizi ve sinoptik paternlerle ilişkisi
Analyzing extreme winds over Turkey and their relationships with synoptic patterns using cluster analysis
UMUT GÜL BAŞAR GÖRGÜN
Doktora
Türkçe
2024
Meteorolojiİstanbul Teknik ÜniversitesiMeteoroloji Mühendisliği Ana Bilim Dalı
PROF. DR. ŞÜKRAN SİBEL MENTEŞ