SPADIS: Selecting predictive and diverse SNPS in GWAS
SPADIS: GWAS çalışmalarında açıklayıcı ve çeşitli SNPS seçimi
- Tez No: 515938
- Danışmanlar: DR. ÖĞR. ÜYESİ ABDULLAH ERCÜMENT ÇİÇEK, DR. ÖĞR. ÜYESİ ÖZNUR TAŞTAN OKAN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2018
- Dil: İngilizce
- Üniversite: İhsan Doğramacı Bilkent Üniversitesi
- Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 65
Özet
Genom çapında ilişkilendirme çalışmalarında (Genome-Wide Association Studies - GWAS) saptanan genetik varyasyonlar nadiren tek başlarına karmaşık hastalıkların kalıtsal aktarımını açıklamakta başarılı olabilmektedirler. Şimdiye kadar, fenotiple ilişkili olan varyasyonların bir alt kümesini seçmek amacıyla çeşitli yöntemler geliştirilmiştir. Bu yöntemlerden bazılarında, tekil nükleotit polimorfizmlerini (Single Nucleotide Polymorphism - SNP) bir SNP-SNP ağında bağlı şekilde ödüllendiren bir yaklaşım izlenmiştir. Bu yaklaşımın fenotipi açıklayıcı ve biyolojik anlamda yorumlanabilir SNP'leri bulmakta başarılı sonuçlar elde ettiği de gösterilmiştir. Fakat, bizim hipotezimize göre, ağ üzerinde bağlılık kısıtlaması yapmak benzer biyolojik süreçleri etkileyen, ihtiyaç fazlası SNP'lerin seçimini destekler ve bu da fenotipi açıklama gücünde potansiyel bir kayba sebep olabilir. Bu doğrultudaki çalışmamızda, birbirini tamamlayıcı etkiye sahip olması adına, ağ üzerinde yakın SNP'leri seçmekten kaçınan SPADIS adında yeni bir yöntem sunulmaktadır. SPADIS bu işlevini, altmodüler bir fonksiyonun azami değerine yakınlığını bir sabit çarpan (1-1/e) ile garanti edebilen açgözlü (greedy) bir algoritma ile yerine getirmektedir. SPADIS, deneylerimizde, modern yöntemlerden biri olan SConES ile Arabidopsis Thaliana verisinde karşılaştırılmıştır: Fenotip açıklayabilme ölçütünde ortalama olarak 17 fenotipin 15'inde daha iyi sonuçlar elde edilmekle birlikte, çeşitli ağ ve kurgular arasında istikrarlı gelişmeler de sağlanmıştır. Üstelik, SPADIS'in fenotip ile ilişki daha fazla sayıda gen saptadığı ve çalışmasını daha kısa sürede tamamladığı gösterilmiştir. Ayrıca, deneylerimizde, Hi-C verisinin SNP seçimi problemi çerçevesinde SNP-SNP ağı oluşturmadaki kullanımı incelenmiş ve bunun test edilen tüm yöntemlerin fenotipi açıklamasına katkıda bulunduğu gözlemlenmiştir.
Özet (Çeviri)
Phenotypic heritability of complex traits and diseases is seldom explained by individual genetic variants identfied in genome-wide association studies (GWAS). Many methods have been developed to select a subset of variant loci, which are associated with or predictive of the phenotype. Selecting connected Single Nucleotide Polymorphisms (SNPs) on SNP-SNP networks has been proven successful finding biologically interpretable and predictive SNPs. However, we argue that the connectedness constraint favors selecting redundant features that affect similar biological processes and therefore does not necessarily yield better predictive performance. To this end, we propose a novel method called SPADIS that favors the selection of remotely located SNPs in order to account for their complementary effects in explaining a phenotype. SPADIS selects a diverse set of loci on a SNP-SNP network. This is achieved by maximizing a submodular set function with a greedy algorithm that ensures a constant factor (1 - 1/e) approximation to the optimal solution. We compare SPADIS to the state-of-the-art method SConES, on a dataset of Arabidopsis Thaliana with continuous flowering time phenotypes. SPADIS has better average phenotype prediction performance in 15 out of 17 phenotypes when the same number of SNPs are selected and provides consistent improvements across multiple networks and settings on average. Moreover, it identifies more candidate genes and runs faster. We also investigate the use of Hi-C data to construct a SNP SNP network in the context of SNP selection problem for the first time, which yields improvements in regression performance across all methods.
Benzer Tezler
- Proksimal humerus kırıklı hastalarda hemiartroplasti sonuçlarımız (Klinik, radyografik ve ultrasonografik değerlendirmeler)
Hemiarthroplasty results ın patients with proximal humerus fractures
TURAN ALPARSLAN YAROĞLU
Tıpta Uzmanlık
Türkçe
2011
Ortopedi ve TravmatolojiMersin ÜniversitesiOrtopedi ve Travmatoloji Ana Bilim Dalı
PROF. DR. VOLKAN ÖZTUNA
- Kemâl-nâme-i Düğümlü Baba Cild-i Sâdis (İnceleme-metin)
Kemal-name-i Dugumlu Baba Jild 6 (Text and analysis)
MELİKE ŞENTÜRK
Yüksek Lisans
Türkçe
2024
Türk Dili ve EdebiyatıSakarya Üniversitesiİslam Tarihi ve Sanatları Ana Bilim Dalı
DOÇ. DR. KENAN MERMER
- Pyotr İlyiç Çaykovski'nin Pıque Dame-Maça Kızı Operasının incelenmesi
An analysis of Pyotr Ilyich Tchaikovsky's opera Pique Dame-The Gueen of Spades
ECEM ÇALHAN
- A.S. Puşkin'in 'Maça Kızı'' adlı eseri üzerinden Rusçadan Türkçeye çeviride transformasyon teorisi
The transformation theory in Russian-Turkish translation through an analysis of A. S. Pushkin's 'The Queen of Spades
REŞAT YILDIZ
Yüksek Lisans
Türkçe
2017
DilbilimGazi ÜniversitesiRus Dili ve Edebiyatı Ana Bilim Dalı
DOÇ. DR. GAMZE ÖKSÜZ