Geri Dön

Similarity search and analysis of protein sequences and structures: A residue contacts based approach

Protein dizilerinin ve yapılarının benzerlik araması ve analizi: Amino asit temaslarına dayalı bir yaklaşım

  1. Tez No: 176779
  2. Yazar: AHMET SAÇAN
  3. Danışmanlar: DOÇ. DR. HAKAN FERHATOSMANOĞLU, PROF. DR. İ. HAKKI TOROSLU
  4. Tez Türü: Doktora
  5. Konular: Biyoloji, Moleküler Tıp, Biology, Molecular Medicine
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2008
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 136

Özet

Protein dizisi ve yapısının yüksek-verimli tespitine olanak sağlayan yöntemlerin hasıl olmasının, hayatın dilini çözümleme arzu ve çabamız üzerinde muazzam tesiri olmuştur. Biyolojik moleküllerin benzerliklerinin, farklılıklarının ve birbirleriyle etkileşimlerinin incelenmesinden yola çıkarak bunların vazifesi, işleyişi ve evrimi ile ilgili yeni keşifler yapılabilmesi gayesiyle, genetik ve protein verileri artık fevkalade bir hızla biriktirilmektedir. Ancak biyo-moleküler veritabanlarının gün geçtikçe büyümesi, bu bilginin duyarlı ve etkili yönetimi ve analizini sağlayabilecek yeni bilişsel yöntemlerin geliştirilmesini gerekli kılmaktadır.Bu çalışmada, protein dizilerinin ve yapılarının erişimi ve karşılaştırmasını sahih ve oldukça etkili yapmaya olanak sağlayan yaklaşımlarımızı önermekte ve gerçekleştirmekteyiz. Benzer proteinlerin birbirine karşılık gelen amino asitlerinin diğer amino asitlerle benzer temaslarda bulunduğu gözleminden yola çıkarak, biyolojik olarak anlamlı sonuçlar veren ve proteinlerin doğru hizalanmasını ve karşılaştırılmasını sağlayan yeni bir takım amino asit değişim dizeyleri elde ettik. Bu dizeyleri, hem protein dizilerinin hem de yapılarının etkin bir şekilde indekslenmesinde kullandık. Protein alt-dizilerini vektörel bir temsile indirgeyip yaklaşık, ama oldukça hızlı indeksleme ve benzerlik araması gerçekleştiren bir metod geliştirdik.Protein yapılarının erişimi ve karşılaştırılması şu ana kadar ayrı ayrı ele alınnıyordu. Biz ise, aynı anda her iki işlevi gören ve diğer yöntemlerden daha iyi sonuç veren bütünleşik bir yaklaşım önerdik. Yaklaşımımız, benzer amino asit temaslarının uzaklık-tabanlı indeksleme kullanılarak tayinine dayalı olup her iki alanda da en iyi sonuçlara ulaşmıştır: ayrıntılı yapısal hizalama algoritmalarının doğruluğunda sonuç verirken, bunu yapısal erişim algoritmalarının hızıyla karşılaştırılabilir bir hızda gerçekleştirebilmektedir. Bu çalışmamızda geliştirdiğimiz yöntem ve araçların, yeni proteinlerin vazifelerinin tayini, işlevsel desenlerin keşfi, genler ve türler arasındaki evrimsel ilişkilerin açığa çıkarılması, ve yeni ilaçların bulunması ve hedeflenmesi gibi alanlarda uygulama bulacağını beklemekteyiz.

Özet (Çeviri)

The advent of high-throughput sequencing and structure determination techniques has had a tremendous impact on our quest in cracking the language of life. The genomic and protein data is now being accumulated at a phenomenal rate, with the motivation of deriving insights into the function, mechanism, and evolution of the biomolecules, through analysis of their similarities, differences, and interactions. The rapid increase in the size of the biomolecular databases, however, calls for development of new computational methods for sensitive and efficient management and analysis of this information.In this thesis, we propose and implement several approaches for accurate and highly efficient comparison and retrieval of protein sequences and structures. The observation that corresponding residues in related proteins share similar inter-residue contacts is exploited in derivation of a new set of biologically sensitive metric amino acid substitution matrices, yielding accurate alignment and comparison of proteins. The metricity of these matrices has allowed efficient indexing and retrieval of both protein sequences and structures. A landmark-guided embedding of protein sequences is developed to represent subsequences in a vector space for approximate, but extremely fast spatial indexing and similarity search.Whereas protein structure comparison and search tasks were hitherto handled separately, we propose an integrated approach that serves both of these tasks and performs comparable to or better than other available methods. Our approach hinges on identification of similar residue contacts using distance-based indexing and provides the best of the both worlds: the accuracy of detailed structure alignment algorithms, at a speed comparable to that of the structure retrieval algorithms. We expect that the methods and tools developed in this study will find use in a wide range of application areas including annotation of new proteins, discovery of functional motifs, discerning evolutionary relationships among genes and species, and drug design and targeting.

Benzer Tezler

  1. Sequence alignment using hidden Markov method

    Hıdden Markov metodu kullanarak dizin hizalama

    MUSTAFA DURAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2011

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFatih Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. TUĞRUL YANIK

    YRD. DOÇ. DR. İHSAN ÖMÜR BUCAK

  2. Discovery of novel enzymes using proteomic approaches

    Proteomik yaklaşımlar kullanılarak yeni enzimlerin keşfi

    MERVE ÖZTUĞ KILINÇ

    Doktora

    İngilizce

    İngilizce

    2021

    Biyokimyaİstanbul Teknik Üniversitesi

    Moleküler Biyoloji-Genetik ve Biyoteknoloji Ana Bilim Dalı

    PROF. DR. NEVİN GÜL KARAGÜLER

    DOÇ. DR. MÜSLÜM AKGÖZ

  3. Selection and similarity analysis of quartz spesific dodecapeptides by phage display selection protocol

    Faj gösterim seçim tekniği ile kuartza bağlanan dodekapeptitlerin seçilmesi ve benzerlik analizi

    DENİZ ŞAHİN

    Yüksek Lisans

    İngilizce

    İngilizce

    2005

    Biyoteknolojiİstanbul Teknik Üniversitesi

    İleri Teknolojiler Ana Bilim Dalı

    DOÇ. DR. CANDAN TAMERLER

    PROF. DR. MEHMET SARIKAYA

  4. HANEIN-1, a novel conserved eukaryotic protein ubiquitously expressed in human tissues

    HANEIN-1, tüm insan dokularında ifadesi görülen korunmuş yeni bir ökaryotik protein

    SERAP ERKEK

    Yüksek Lisans

    İngilizce

    İngilizce

    2008

    Biyolojiİhsan Doğramacı Bilkent Üniversitesi

    Moleküler Biyoloji ve Genetik Ana Bilim Dalı

    YRD. DOÇ. DR. UYGAR H. TAZEBAY

  5. Isolation and characterization of genomic and cDNA sequences encoding the laccase CpLcc2 from Coriolopsis polyzona MUCL 38443

    Coriolopsis polyzona MUCL 38443 suşundaki CpLcc2 lakkazını kodlayan genomik ve cDNA dizilerinin izolasyonu ve karakterizasyonu

    DİCLE MALAYMAR

    Yüksek Lisans

    İngilizce

    İngilizce

    2016

    Biyoteknolojiİstanbul Teknik Üniversitesi

    Moleküler Biyoloji-Genetik ve Biyoteknoloji Ana Bilim Dalı

    PROF. DR. AYTEN KARATAŞ