Geri Dön

SPADIS: Selecting predictive and diverse SNPS in GWAS

SPADIS: GWAS çalışmalarında açıklayıcı ve çeşitli SNPS seçimi

  1. Tez No: 515938
  2. Yazar: SERHAN YILMAZ
  3. Danışmanlar: DR. ÖĞR. ÜYESİ ABDULLAH ERCÜMENT ÇİÇEK, DR. ÖĞR. ÜYESİ ÖZNUR TAŞTAN OKAN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2018
  8. Dil: İngilizce
  9. Üniversite: İhsan Doğramacı Bilkent Üniversitesi
  10. Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 65

Özet

Genom çapında ilişkilendirme çalışmalarında (Genome-Wide Association Studies - GWAS) saptanan genetik varyasyonlar nadiren tek başlarına karmaşık hastalıkların kalıtsal aktarımını açıklamakta başarılı olabilmektedirler. Şimdiye kadar, fenotiple ilişkili olan varyasyonların bir alt kümesini seçmek amacıyla çeşitli yöntemler geliştirilmiştir. Bu yöntemlerden bazılarında, tekil nükleotit polimorfizmlerini (Single Nucleotide Polymorphism - SNP) bir SNP-SNP ağında bağlı şekilde ödüllendiren bir yaklaşım izlenmiştir. Bu yaklaşımın fenotipi açıklayıcı ve biyolojik anlamda yorumlanabilir SNP'leri bulmakta başarılı sonuçlar elde ettiği de gösterilmiştir. Fakat, bizim hipotezimize göre, ağ üzerinde bağlılık kısıtlaması yapmak benzer biyolojik süreçleri etkileyen, ihtiyaç fazlası SNP'lerin seçimini destekler ve bu da fenotipi açıklama gücünde potansiyel bir kayba sebep olabilir. Bu doğrultudaki çalışmamızda, birbirini tamamlayıcı etkiye sahip olması adına, ağ üzerinde yakın SNP'leri seçmekten kaçınan SPADIS adında yeni bir yöntem sunulmaktadır. SPADIS bu işlevini, altmodüler bir fonksiyonun azami değerine yakınlığını bir sabit çarpan (1-1/e) ile garanti edebilen açgözlü (greedy) bir algoritma ile yerine getirmektedir. SPADIS, deneylerimizde, modern yöntemlerden biri olan SConES ile Arabidopsis Thaliana verisinde karşılaştırılmıştır: Fenotip açıklayabilme ölçütünde ortalama olarak 17 fenotipin 15'inde daha iyi sonuçlar elde edilmekle birlikte, çeşitli ağ ve kurgular arasında istikrarlı gelişmeler de sağlanmıştır. Üstelik, SPADIS'in fenotip ile ilişki daha fazla sayıda gen saptadığı ve çalışmasını daha kısa sürede tamamladığı gösterilmiştir. Ayrıca, deneylerimizde, Hi-C verisinin SNP seçimi problemi çerçevesinde SNP-SNP ağı oluşturmadaki kullanımı incelenmiş ve bunun test edilen tüm yöntemlerin fenotipi açıklamasına katkıda bulunduğu gözlemlenmiştir.

Özet (Çeviri)

Phenotypic heritability of complex traits and diseases is seldom explained by individual genetic variants identfied in genome-wide association studies (GWAS). Many methods have been developed to select a subset of variant loci, which are associated with or predictive of the phenotype. Selecting connected Single Nucleotide Polymorphisms (SNPs) on SNP-SNP networks has been proven successful finding biologically interpretable and predictive SNPs. However, we argue that the connectedness constraint favors selecting redundant features that affect similar biological processes and therefore does not necessarily yield better predictive performance. To this end, we propose a novel method called SPADIS that favors the selection of remotely located SNPs in order to account for their complementary effects in explaining a phenotype. SPADIS selects a diverse set of loci on a SNP-SNP network. This is achieved by maximizing a submodular set function with a greedy algorithm that ensures a constant factor (1 - 1/e) approximation to the optimal solution. We compare SPADIS to the state-of-the-art method SConES, on a dataset of Arabidopsis Thaliana with continuous flowering time phenotypes. SPADIS has better average phenotype prediction performance in 15 out of 17 phenotypes when the same number of SNPs are selected and provides consistent improvements across multiple networks and settings on average. Moreover, it identifies more candidate genes and runs faster. We also investigate the use of Hi-C data to construct a SNP SNP network in the context of SNP selection problem for the first time, which yields improvements in regression performance across all methods.

Benzer Tezler

  1. Proksimal humerus kırıklı hastalarda hemiartroplasti sonuçlarımız (Klinik, radyografik ve ultrasonografik değerlendirmeler)

    Hemiarthroplasty results ın patients with proximal humerus fractures

    TURAN ALPARSLAN YAROĞLU

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2011

    Ortopedi ve TravmatolojiMersin Üniversitesi

    Ortopedi ve Travmatoloji Ana Bilim Dalı

    PROF. DR. VOLKAN ÖZTUNA

  2. Üretim planlama kontrol ve spariş üretimi

    Başlık çevirisi yok

    NUMAN SAİT EREN

    Yüksek Lisans

    Türkçe

    Türkçe

    1984

    İşletmeİstanbul Üniversitesi

    Üretim Yönetimi Ana Bilim Dalı

  3. Kemâl-nâme-i Düğümlü Baba Cild-i Sâdis (İnceleme-metin)

    Kemal-name-i Dugumlu Baba Jild 6 (Text and analysis)

    MELİKE ŞENTÜRK

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Türk Dili ve EdebiyatıSakarya Üniversitesi

    İslam Tarihi ve Sanatları Ana Bilim Dalı

    DOÇ. DR. KENAN MERMER

  4. Pyotr İlyiç Çaykovski'nin Pıque Dame-Maça Kızı Operasının incelenmesi

    An analysis of Pyotr Ilyich Tchaikovsky's opera Pique Dame-The Gueen of Spades

    ECEM ÇALHAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Müzikİstanbul Okan Üniversitesi

    Müzik Ana Bilim Dalı

    DOÇ. DR. SETA KÜRKÇÜOĞLU

  5. A.S. Puşkin'in 'Maça Kızı'' adlı eseri üzerinden Rusçadan Türkçeye çeviride transformasyon teorisi

    The transformation theory in Russian-Turkish translation through an analysis of A. S. Pushkin's 'The Queen of Spades

    REŞAT YILDIZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2017

    DilbilimGazi Üniversitesi

    Rus Dili ve Edebiyatı Ana Bilim Dalı

    DOÇ. DR. GAMZE ÖKSÜZ