Prediction of protein-protein interactions from sequence using evolutionary relations of proteins and species
Protein protein etkileşimlerinin sekans bilgisinden protein ve türler arasındaki evrimsel ilişkileri kullanarak tahmin edilmesi
- Tez No: 255257
- Danışmanlar: YRD. DOÇ. DR. TOLGA CAN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2009
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 53
Özet
Protein-protein etkileşim tahmini, bir hücredeki biolojik süreçleri anlamanın en önemli adımlarından biridir.Pek cok sekansı bilinen organizmanın henüz deneylerle doğrulanmış protein-protein etkileşim ağları bulunmamaktadır.Bu tip organizmaların için, bir öğrenme verisine ihtiyaç duyan tipik makine öğrenme algoritmaları uygulanamaz.Ayrıca, yeni sekanslanmış organizmaların, genelde protein-protein etkileşimlerini tahmin etmek icin kullanılanbiyokimyasal veriler de bulunmayabilir. Bu tez calışmasında, protein-protein etkileşim ikililerini sadece genomunsekans ve evrimsel bilgilerini kullanarak bulmak ve kümelemeye calıştık. Evrimsel baskı hipotezinin benzer filogenetik profillere sahip proteinlerin etkileşim olasılığının yüksek olduğu önermesinden yararlanarak,tez calışmasında proteinlerin filogenetik profillerini kullandık. Ayrıca bu filogenetik profilleri evrimsel çizgileregöre daha küçük gruplara böldük. Bu bölünmüş profilleri iki proteinin filogenetik olarak benzerliğine puanvermek icin kullandık. Profilin içindeki gruplarda her zaman aynı sayıda eleman olmadığı için, bu gruplarınbenzerliğine puan verebilecek yeni bir benzerlik fonksiyonu ürettik. Aynı zamanda sık kullanılan benzerlikfonksiyonlarının bu duruma uygun olmadığını gösterdik. Çıkan benzerlik puanlarını daha sonra MarkovKümeleme algoritmasına vererek sonuçları kümeledik. Sonuçta çıkan kümeler içinde kalan proteinlerinfonksiyonel olarak benzer özelliklere sahip olması ve etkileşim içinde olması yüksek bir olasılıktır. Herne kadar bu method diğer makine oğrenme algoritmaları kadar iyi çalışmasa da, öğrenme verisineihtiyaç duymaması ve sadece sekans veevrim bilgilerini kullanarak çalışmasının bir avantaj olduğu söylenebilir. Bu metod protein proteinetkileşimlerinin tanımlanmasında bir ilk adım olarak kullanılabilir.
Özet (Çeviri)
Prediction of protein-protein interactions is an important part in understanding the biologicalprocesses in a living cell. There are completely sequenced organisms that do not yet haveexperimentally verified protein-protein interaction networks. For such organisms, we cannot generally use a supervised method, where a portion of the protein-protein interactionnetwork is used as training set. Furthermore, for newly-sequenced organisms, many otherdata sources, such as gene expression data and gene ontology annotations, that are used toidentify protein-protein interaction networks may not be available. In this thesis work, ouraim is to identify and cluster likely protein-protein interaction pairs using only sequence ofproteins and evolutionary information. We use a protein?s phylogenetic pro ? le because theco-evolutionary pressure hypothesis suggests that proteins with similar phylogenetic pro ? lesare likely to interact. We also divide phylogenetic pro ? le into smaller pro ? les based on theevolutionary lines. These divided pro ? les are then used to score the similarity between allpossible protein pairs. Since not all pro ? le groups have the same number of elements, it isa difficult task to assess the similarity between such pairs. We show that many commonlyused measures do not work well and that the end result greatly depends on the type of thesimilarity measure used. We also introduce a novel similarity measure. The resulting denseputative interaction network contains many false-positive interactions, therefore we apply theMarkov Clustering algorithm to cluster the protein-protein interaction network and ? lter outthe weaker edges. The end result is a set of clusters where proteins within the clusters arelikely to be functionally linked and to interact. While this method does not perform as wellas supervised methods, it has the advantage of not requiring a training set and being able towork only using sequence data and evolutionary information. So it can be used as a ? rst stepin identifying protein-protein interactions in newly-sequenced organisms.
Benzer Tezler
- Identification of the interaction partners of anti-apoptotic BAG-1M isoform in breast cancer and breast epithelial cells
Anti-apoptotik BAG-1M izoformunun etkileşim partnerlerinin meme kanseri ve meme epitel hücrelerinde tanımlanması
NİSAN DENİZCE CAN
Yüksek Lisans
İngilizce
2017
Biyolojiİstanbul Teknik ÜniversitesiMoleküler Biyoloji-Genetik ve Biyoteknoloji Ana Bilim Dalı
DOÇ. DR. GİZEM DİNLER DOĞANAY
- Constructing peptide (GEPI)-protein molecular hybrids by using genetic engineering methods for materials and medical applications.
Malzeme ve medikal uygulamalar için gen mühendisliği yoluyla peptid (GEPI)-protein hibritlerin oluşması.
DENİZ ŞAHİN
Doktora
İngilizce
2011
Biyomühendislikİstanbul Teknik Üniversitesiİleri Teknolojiler Ana Bilim Dalı
PROF. DR. CANDAN TAMERLER
PROF. DR. MEHMET SARIKAYA
- Computational approaches to understanding the protein structure
Protein yapısını anlamak için işlemsel yaklaşımlar
PELİN AKAN
- Yapay zekâ tekniklerinin kullanımıyla protein etkileşimlerinin sekans bilgisine dayalı tahmini
Prediction of protein interactions by using artificial intelligence techniques based on protein sequence data
YUNUS EMRE GÖKTEPE
Doktora
Türkçe
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKonya Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. HALİFE KODAZ
- Prediction of protein-protein interactions through sequence based contrastive representation learning method
Sekans tabanlı ayrımsal temsil öğrenmesi yöntemi ile protein-protein etkileşimlerinin tahmini
DUYGU GEÇKİN
Yüksek Lisans
İngilizce
2023
Elektrik ve Elektronik MühendisliğiDokuz Eylül ÜniversitesiBiyomedikal Teknolojiler Ana Bilim Dalı
DOÇ. DR. GÜLESER KALAYCI DEMİR