Similarity search and analysis of protein sequences and structures: A residue contacts based approach
Protein dizilerinin ve yapılarının benzerlik araması ve analizi: Amino asit temaslarına dayalı bir yaklaşım
- Tez No: 176779
- Danışmanlar: DOÇ. DR. HAKAN FERHATOSMANOĞLU, PROF. DR. İ. HAKKI TOROSLU
- Tez Türü: Doktora
- Konular: Biyoloji, Moleküler Tıp, Biology, Molecular Medicine
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2008
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 136
Özet
Protein dizisi ve yapısının yüksek-verimli tespitine olanak sağlayan yöntemlerin hasıl olmasının, hayatın dilini çözümleme arzu ve çabamız üzerinde muazzam tesiri olmuştur. Biyolojik moleküllerin benzerliklerinin, farklılıklarının ve birbirleriyle etkileşimlerinin incelenmesinden yola çıkarak bunların vazifesi, işleyişi ve evrimi ile ilgili yeni keşifler yapılabilmesi gayesiyle, genetik ve protein verileri artık fevkalade bir hızla biriktirilmektedir. Ancak biyo-moleküler veritabanlarının gün geçtikçe büyümesi, bu bilginin duyarlı ve etkili yönetimi ve analizini sağlayabilecek yeni bilişsel yöntemlerin geliştirilmesini gerekli kılmaktadır.Bu çalışmada, protein dizilerinin ve yapılarının erişimi ve karşılaştırmasını sahih ve oldukça etkili yapmaya olanak sağlayan yaklaşımlarımızı önermekte ve gerçekleştirmekteyiz. Benzer proteinlerin birbirine karşılık gelen amino asitlerinin diğer amino asitlerle benzer temaslarda bulunduğu gözleminden yola çıkarak, biyolojik olarak anlamlı sonuçlar veren ve proteinlerin doğru hizalanmasını ve karşılaştırılmasını sağlayan yeni bir takım amino asit değişim dizeyleri elde ettik. Bu dizeyleri, hem protein dizilerinin hem de yapılarının etkin bir şekilde indekslenmesinde kullandık. Protein alt-dizilerini vektörel bir temsile indirgeyip yaklaşık, ama oldukça hızlı indeksleme ve benzerlik araması gerçekleştiren bir metod geliştirdik.Protein yapılarının erişimi ve karşılaştırılması şu ana kadar ayrı ayrı ele alınnıyordu. Biz ise, aynı anda her iki işlevi gören ve diğer yöntemlerden daha iyi sonuç veren bütünleşik bir yaklaşım önerdik. Yaklaşımımız, benzer amino asit temaslarının uzaklık-tabanlı indeksleme kullanılarak tayinine dayalı olup her iki alanda da en iyi sonuçlara ulaşmıştır: ayrıntılı yapısal hizalama algoritmalarının doğruluğunda sonuç verirken, bunu yapısal erişim algoritmalarının hızıyla karşılaştırılabilir bir hızda gerçekleştirebilmektedir. Bu çalışmamızda geliştirdiğimiz yöntem ve araçların, yeni proteinlerin vazifelerinin tayini, işlevsel desenlerin keşfi, genler ve türler arasındaki evrimsel ilişkilerin açığa çıkarılması, ve yeni ilaçların bulunması ve hedeflenmesi gibi alanlarda uygulama bulacağını beklemekteyiz.
Özet (Çeviri)
The advent of high-throughput sequencing and structure determination techniques has had a tremendous impact on our quest in cracking the language of life. The genomic and protein data is now being accumulated at a phenomenal rate, with the motivation of deriving insights into the function, mechanism, and evolution of the biomolecules, through analysis of their similarities, differences, and interactions. The rapid increase in the size of the biomolecular databases, however, calls for development of new computational methods for sensitive and efficient management and analysis of this information.In this thesis, we propose and implement several approaches for accurate and highly efficient comparison and retrieval of protein sequences and structures. The observation that corresponding residues in related proteins share similar inter-residue contacts is exploited in derivation of a new set of biologically sensitive metric amino acid substitution matrices, yielding accurate alignment and comparison of proteins. The metricity of these matrices has allowed efficient indexing and retrieval of both protein sequences and structures. A landmark-guided embedding of protein sequences is developed to represent subsequences in a vector space for approximate, but extremely fast spatial indexing and similarity search.Whereas protein structure comparison and search tasks were hitherto handled separately, we propose an integrated approach that serves both of these tasks and performs comparable to or better than other available methods. Our approach hinges on identification of similar residue contacts using distance-based indexing and provides the best of the both worlds: the accuracy of detailed structure alignment algorithms, at a speed comparable to that of the structure retrieval algorithms. We expect that the methods and tools developed in this study will find use in a wide range of application areas including annotation of new proteins, discovery of functional motifs, discerning evolutionary relationships among genes and species, and drug design and targeting.
Benzer Tezler
- Sequence alignment using hidden Markov method
Hıdden Markov metodu kullanarak dizin hizalama
MUSTAFA DURAN
Yüksek Lisans
İngilizce
2011
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFatih ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. TUĞRUL YANIK
YRD. DOÇ. DR. İHSAN ÖMÜR BUCAK
- Discovery of novel enzymes using proteomic approaches
Proteomik yaklaşımlar kullanılarak yeni enzimlerin keşfi
MERVE ÖZTUĞ KILINÇ
Doktora
İngilizce
2021
Biyokimyaİstanbul Teknik ÜniversitesiMoleküler Biyoloji-Genetik ve Biyoteknoloji Ana Bilim Dalı
PROF. DR. NEVİN GÜL KARAGÜLER
DOÇ. DR. MÜSLÜM AKGÖZ
- Selection and similarity analysis of quartz spesific dodecapeptides by phage display selection protocol
Faj gösterim seçim tekniği ile kuartza bağlanan dodekapeptitlerin seçilmesi ve benzerlik analizi
DENİZ ŞAHİN
Yüksek Lisans
İngilizce
2005
Biyoteknolojiİstanbul Teknik Üniversitesiİleri Teknolojiler Ana Bilim Dalı
DOÇ. DR. CANDAN TAMERLER
PROF. DR. MEHMET SARIKAYA
- HANEIN-1, a novel conserved eukaryotic protein ubiquitously expressed in human tissues
HANEIN-1, tüm insan dokularında ifadesi görülen korunmuş yeni bir ökaryotik protein
SERAP ERKEK
Yüksek Lisans
İngilizce
2008
Biyolojiİhsan Doğramacı Bilkent ÜniversitesiMoleküler Biyoloji ve Genetik Ana Bilim Dalı
YRD. DOÇ. DR. UYGAR H. TAZEBAY
- Isolation and characterization of genomic and cDNA sequences encoding the laccase CpLcc2 from Coriolopsis polyzona MUCL 38443
Coriolopsis polyzona MUCL 38443 suşundaki CpLcc2 lakkazını kodlayan genomik ve cDNA dizilerinin izolasyonu ve karakterizasyonu
DİCLE MALAYMAR
Yüksek Lisans
İngilizce
2016
Biyoteknolojiİstanbul Teknik ÜniversitesiMoleküler Biyoloji-Genetik ve Biyoteknoloji Ana Bilim Dalı
PROF. DR. AYTEN KARATAŞ