Doubletdetector: A method to detect doublet cells in open chromatin regions
Doubletdetector: Açık kromatin bölgelerinde ikili hücre tespit etme aracı
- Tez No: 643512
- Danışmanlar: YRD. DOÇ. DR. ABDULLAH ERCÜMENT ÇİÇEK
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Biyoistatistik, Biyoteknoloji, Computer Engineering and Computer Science and Control, Biostatistics, Biotechnology
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2020
- Dil: İngilizce
- Üniversite: İhsan Doğramacı Bilkent Üniversitesi
- Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 60
Özet
Transpozaz-Erişimli Kromatin Dizinlemesi ile Tahlili (ATAC-seq) kromotinin açıklığını ölçmeye yarayan bir genetik yöntemidir. Genomdaki açık bölgeler, DNA ikileşmesi ve transkripsiyonda rol oynamaktadır. Bu tahlilin nükleozom haritalaması, transkripsiyon düzenleyici unsurların tespiti, kanser ve bağışıklık sistemi yaşlanması alanlarında kullanılmaktadır. Teknolojik gelişmeler sayesinde bu teknik, tek hücre seviyesinde kullanılabilir ve buna tek çekirdek ATAC-seq (snATAC-seq) adı verilmektedir. Tek hücre seviyesine inebilen ATAC-seq sayesinde nadir rastlanan hücre tipleri keşfedilebilir ve onların düzenleme ağlarındaki rolleri belirlenebilir. Diğer tek hücre seviyesindeki teknikler gibi snATAC-seq de ikili hücrelerden zarar görmektedir. İkililer, birden fazla hücrenin aynı anda yakalanması ve dizinlenmesi ile meydana gelir ve daha sonra yapılacak çözümlemeleri kötü etkiler. snATAC-seq verisinin bir özelliği, herhangi bir genom bölgesinde sadece annenin ve babanın kromozomlarından gelen iki keşisen okuma olabilir. Eğer bir bölgede ikiden fazla kesişen okuma görülürse, bu; ikili hücreler veya bir dizinleme hatası nedeniyle meydana gelebilir. Biz de bu biyolojik özelliği kullanarak ikili hücreleri tespit etmeye yarayacak DoubletDetector adındaki aracı geliştirdik. Bu araç her hücre için kaç tane genom bölgesinde ikiden fazla kesişen okuma olduğunu saymakta ve bu durumun sık karşılaşıldığı hücereleri işaretlemektedir. Daha sonra bu ikiliyi meydana getiren hücreleri hangi hücre tiplerinden olduğunu da tespit etmektedir. Bu aracı tek çekirdekli çevresel kan hücreleri (PBMC) ve adacık hücreleri ile denedik ve simüle edilen ikili hücreleri \%90 oranında doğru tespit edebildik. Bu yapay hücrelerin hangi hücre tiplerinden geldiklerini ise \%78 oranında doğruladık. DoubletDetector, başarılı şekilde hem çok-kaynaklı hem de tek-kaynaklı ikili hücreleri tespit edebilen ilk araçtır.
Özet (Çeviri)
Assay for Transposase-Accessible Chromatin using sequencing (ATAC-seq) is a simple and effective technique in genomic studies that shows the chromatin accessibility of the genome. The open regions of the genome play an important role in DNA replication and transcription. It has many practical applications such as nucleosome mapping, identifying regulatory elements, cancer research and immune system aging. With the development of the technology used, this technique is now applied at single cell level in the form of single nucleus ATAC-seq (snATAC-seq). Single cell level resolution helps further the possible implications of ATAC-seq by helping in detection of rare cell types that play roles in the regulatory networks. Like other single cell technologies, snATAC-seq suffers from the existence of doublet cells that occur when multiple cells are simultaneously captured and sequenced which confounds downstream analyses. A unique property of snATAC-seq data is that at a given loci in the genome there can be at most two overlapping reads, one from the maternal and other from the paternal chromosome. When a loci has more than 2 reads this can be due to doublets or alignment/sequencing errors. We propose a count-based method, DoubletDetector, that makes use of this property to detect doublets. It identifies doublets by counting the number of loci within the cell that has more than 2 ATAC-seq reads. It also finds the types of the cells that formed the doublets, to further help understand their nature. DoubletDetector achieved high recall near 90\% for detecting simulated doublets in human PBMC and islet snATAC-seq samples. Artificial doublets were then traced back to their cells of origin with near 78\% recall using a marker peak-based algorithm. DoubletDetector is the first method to effectively identify both homotypic and heterotypic doublets from snATAC-seq.