Geri Dön

Prediction of protein-protein interactions from sequence using evolutionary relations of proteins and species

Protein protein etkileşimlerinin sekans bilgisinden protein ve türler arasındaki evrimsel ilişkileri kullanarak tahmin edilmesi

  1. Tez No: 255257
  2. Yazar: TACETTİN DOĞACAN GÜNEY
  3. Danışmanlar: YRD. DOÇ. DR. TOLGA CAN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2009
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 53

Özet

Protein-protein etkileşim tahmini, bir hücredeki biolojik süreçleri anlamanın en önemli adımlarından biridir.Pek cok sekansı bilinen organizmanın henüz deneylerle doğrulanmış protein-protein etkileşim ağları bulunmamaktadır.Bu tip organizmaların için, bir öğrenme verisine ihtiyaç duyan tipik makine öğrenme algoritmaları uygulanamaz.Ayrıca, yeni sekanslanmış organizmaların, genelde protein-protein etkileşimlerini tahmin etmek icin kullanılanbiyokimyasal veriler de bulunmayabilir. Bu tez calışmasında, protein-protein etkileşim ikililerini sadece genomunsekans ve evrimsel bilgilerini kullanarak bulmak ve kümelemeye calıştık. Evrimsel baskı hipotezinin benzer filogenetik profillere sahip proteinlerin etkileşim olasılığının yüksek olduğu önermesinden yararlanarak,tez calışmasında proteinlerin filogenetik profillerini kullandık. Ayrıca bu filogenetik profilleri evrimsel çizgileregöre daha küçük gruplara böldük. Bu bölünmüş profilleri iki proteinin filogenetik olarak benzerliğine puanvermek icin kullandık. Profilin içindeki gruplarda her zaman aynı sayıda eleman olmadığı için, bu gruplarınbenzerliğine puan verebilecek yeni bir benzerlik fonksiyonu ürettik. Aynı zamanda sık kullanılan benzerlikfonksiyonlarının bu duruma uygun olmadığını gösterdik. Çıkan benzerlik puanlarını daha sonra MarkovKümeleme algoritmasına vererek sonuçları kümeledik. Sonuçta çıkan kümeler içinde kalan proteinlerinfonksiyonel olarak benzer özelliklere sahip olması ve etkileşim içinde olması yüksek bir olasılıktır. Herne kadar bu method diğer makine oğrenme algoritmaları kadar iyi çalışmasa da, öğrenme verisineihtiyaç duymaması ve sadece sekans veevrim bilgilerini kullanarak çalışmasının bir avantaj olduğu söylenebilir. Bu metod protein proteinetkileşimlerinin tanımlanmasında bir ilk adım olarak kullanılabilir.

Özet (Çeviri)

Prediction of protein-protein interactions is an important part in understanding the biologicalprocesses in a living cell. There are completely sequenced organisms that do not yet haveexperimentally verified protein-protein interaction networks. For such organisms, we cannot generally use a supervised method, where a portion of the protein-protein interactionnetwork is used as training set. Furthermore, for newly-sequenced organisms, many otherdata sources, such as gene expression data and gene ontology annotations, that are used toidentify protein-protein interaction networks may not be available. In this thesis work, ouraim is to identify and cluster likely protein-protein interaction pairs using only sequence ofproteins and evolutionary information. We use a protein?s phylogenetic pro ? le because theco-evolutionary pressure hypothesis suggests that proteins with similar phylogenetic pro ? lesare likely to interact. We also divide phylogenetic pro ? le into smaller pro ? les based on theevolutionary lines. These divided pro ? les are then used to score the similarity between allpossible protein pairs. Since not all pro ? le groups have the same number of elements, it isa difficult task to assess the similarity between such pairs. We show that many commonlyused measures do not work well and that the end result greatly depends on the type of thesimilarity measure used. We also introduce a novel similarity measure. The resulting denseputative interaction network contains many false-positive interactions, therefore we apply theMarkov Clustering algorithm to cluster the protein-protein interaction network and ? lter outthe weaker edges. The end result is a set of clusters where proteins within the clusters arelikely to be functionally linked and to interact. While this method does not perform as wellas supervised methods, it has the advantage of not requiring a training set and being able towork only using sequence data and evolutionary information. So it can be used as a ? rst stepin identifying protein-protein interactions in newly-sequenced organisms.

Benzer Tezler

  1. Identification of the interaction partners of anti-apoptotic BAG-1M isoform in breast cancer and breast epithelial cells

    Anti-apoptotik BAG-1M izoformunun etkileşim partnerlerinin meme kanseri ve meme epitel hücrelerinde tanımlanması

    NİSAN DENİZCE CAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2017

    Biyolojiİstanbul Teknik Üniversitesi

    Moleküler Biyoloji-Genetik ve Biyoteknoloji Ana Bilim Dalı

    DOÇ. DR. GİZEM DİNLER DOĞANAY

  2. Yağ asidi metabolizmasında görevli proteinlerin FoxO3a ile etkileşiminin in silico yöntemlerle incelenmesi

    Examining the interaction of the fatty acid metabolism proteins with the FoxO3a by using in silico methods

    İLKE SARAK

    Yüksek Lisans

    Türkçe

    Türkçe

    2025

    Bilim ve Teknolojiİstanbul Kültür Üniversitesi

    Moleküler Biyokimya ve Genetik Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ PELİN ÖZFİLİZ KILBAŞ

  3. Constructing peptide (GEPI)-protein molecular hybrids by using genetic engineering methods for materials and medical applications.

    Malzeme ve medikal uygulamalar için gen mühendisliği yoluyla peptid (GEPI)-protein hibritlerin oluşması.

    DENİZ ŞAHİN

    Doktora

    İngilizce

    İngilizce

    2011

    Biyomühendislikİstanbul Teknik Üniversitesi

    İleri Teknolojiler Ana Bilim Dalı

    PROF. DR. CANDAN TAMERLER

    PROF. DR. MEHMET SARIKAYA

  4. SLC2A2 geninin mutasyon taraması ve Tip2 Şeker hastalığı ile ilişkisinin araştırılması

    Mutation screening of the SLC2A2(GLUT2) gene and investigation of its relationship with Type2 Diabetes

    DAMLA BİÇER

    Yüksek Lisans

    Türkçe

    Türkçe

    2025

    GenetikTekirdağ Namık Kemal Üniversitesi

    Tıbbi Genetik Ana Bilim Dalı

    DOÇ. DR. BİROL TOPÇU

    DOÇ. DR. SERTAÇ ATALAY

  5. Computational approaches to understanding the protein structure

    Protein yapısını anlamak için işlemsel yaklaşımlar

    PELİN AKAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2002

    BiyolojiSabancı Üniversitesi

    YRD. DOÇ. DR. UĞUR O. SEZERMAN