Geri Dön

Prediction of protein-protein interactions through sequence based contrastive representation learning method

Sekans tabanlı ayrımsal temsil öğrenmesi yöntemi ile protein-protein etkileşimlerinin tahmini

  1. Tez No: 831128
  2. Yazar: DUYGU GEÇKİN
  3. Danışmanlar: DOÇ. DR. GÜLESER KALAYCI DEMİR
  4. Tez Türü: Yüksek Lisans
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: İngilizce
  9. Üniversite: Dokuz Eylül Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Biyomedikal Teknolojiler Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 67

Özet

Proteinler, sinyal iletimi yapmak, bağışıklık tepkisi oluşturmak ve metabolik döngüler yaratmak gibi spesifik işlevleri yerine getirmek için fiziko-kimyasal bağlantılar oluşturarak protein-protein etkileşimlerini meydana getirirler. Bu etkileşimler, hastalık mekanizmalarının incelenmesi, ilaç ve tedavi tasarımı gibi uygulamalar için büyük potansiyele sahiptir. Bununla birlikte, protein-protein etkileşimlerini belirlemeye yönelik deneysel yöntemler zaman alıcı, pahalı ve kapsamı sınırlıdır. Bu nedenle, protein-protein etkileşimlerinin tanımlaması ve buna yönelik çalışmaları geliştirmek için hesaplama yöntemlerine ihtiyaç duyulmaktadır. Sunulan çalışmanın amacı, proteinlerin sadece sekans bilgilerini kullanarak protein-protein etkileşimlerini derin öğrenme ağı oluşturarak kestirim yapmaktır. İlk olarak, protein sekansları üç farklı yöntem kullanılarak temsil edilmişlerdir: Binary kodlama, otokovaryans, ve Position Specific Scoring Matrix (PSSM). Daha sonra, proteinprotein etkileşim kestirimi yapmak için evrişimli bir Siyam sinir ağı oluşturulmuştur. Ağ mimarisi, aynı parametreleri paylaşan iki özdeş alt ağdan oluşmaktadır ve protein dizisi çiftleri arasındaki karmaşık modellerin saptanmasını sağlamaktadır. Deneysel sonuçlar, PSSM kodlama yönteminin 0,8407 ile en yüksek tahmin doğruluğunu sağladığını göstermiştir. Farklı kodlama metodolojileri, aynı protein sekansında farklı özellikleri yakaladığından, herbir kodlayıcının Siyam sinir ağından çıkan tahmin değerleri toplanarak bir topluluk öğrenmesi yöntemi kullanılarak, tahmin performansı iyileştirilmiştir. Sonuç olarak, tahmin doğruluğu yüzde 0,8627'ye yükselmiştir. Bu sonuçlara göre, protein-protein etkileşim tahmininin doğruluğunu artırmak için çoklu protein kodlama stratejilerini entegre etmenin etkinliğinin önemli olduğu görülmektedir. Kapsamlı deneysel sonuçlar, önerilen yöntemin protein-protein etkileşim tahmini için etkili, sağlam ve güvenilir bir alternatif yaklaşım olduğunu kanıtlamaktadır

Özet (Çeviri)

Proteins engage in protein-protein interactions (PPIs), forming physicochemical connections in order to carry out specialized functions such as transmission of signals, immune response, and metabolic cycles. These interactions hold great potential for applications in drug development, therapy design, and disease mechanism research. However, experimental methods for identifying PPIs are time-consuming, expensive, and limited in coverage. Therefore, computational methods are required to complement and enhance PPI identification. The presented study was aimed to construct PPI deep learning network utilizing only protein sequence information. Initially, protein sequences were encoded using three distinct methods: Binary Encoding, Autocovariance, and Position Specific Scoring Matrix (PSSM). Subsequently, a convolutional Siamese neural network was implemented to predict PPIs. The network architecture consisted of two duplicate subnetworks that used identical parameters to detect complicated patterns between pairs of protein sequences. The results demonstrated that the PSSM encoding method yielded the highest prediction accuracy, achieving 0.8407. Since different encoding methodologies capture diverse features from the same protein sequence, an ensemble method was proposed to aggregate the outputs of these encoders, thereby improving prediction performance. As a result, the prediction accuracy increased to 0.8627. This highlights the efficacy of integrating multiple encoding strategies to harness their complementary strengths and enhance the accuracy of PPI prediction. The comprehensive experimental results prove that the proposed method is an effective, robust and reliable alternative approach for prediction of PPIs.

Benzer Tezler

  1. Target-based drug discovery through contrastive learning and latent optimization

    Karşılaştırmalı öğrenme ve saklı vektör optimizasyonundan yararlanarak hedef bazlı ilaç keşfi

    BURAK CAN KOBAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. ARZUCAN ÖZGÜR TÜRKMEN

    DOÇ. DR. ELİF ÖZKIRIMLI ÖLMEZ

  2. Squence-structure relationships in globular proteins

    Küresel proteinlerde dizin yapı ilişkisi

    MİNE KAPLAN

    Yüksek Lisans

    İngilizce

    İngilizce

    1995

    Kimya MühendisliğiBoğaziçi Üniversitesi

    PROF.DR. İVET BAHAR

  3. From yeast to human: Unraveling sphingolipid metabolism through macroscopic and microscopic analyses

    Mayadan insana: Makroskopik ve mikroskopik analizlerle sfingolipid metabolizmasının incelenmesi

    FATMA BETÜL KAVUN ÖZBAYRAKTAR

    Doktora

    İngilizce

    İngilizce

    2011

    BiyomühendislikBoğaziçi Üniversitesi

    Kimya Mühendisliği Bölümü

    PROF. DR. KUTLU Ö. ÜLGEN

  4. Deepkinzero: Zero-shot learning for predicting kinase phosphorylation sites

    Deepkinzero: Kinaz fosforilasyon yerlerinin sıfır örnek öğrenim ile tahmini

    IMAN DEZNABI

    Yüksek Lisans

    İngilizce

    İngilizce

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    Assist. Prof. Dr. ABDULLAH ERCÜMENT ÇİÇEK

    Assist. Prof. Dr. ÖZNUR TAŞTAN OKAN

  5. A tool for prediction of protein expression from genetic data

    Genetik veriden protein ekspresyonu tahmini için bir araç

    SILA GERLEVİK

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    BiyoistatistikAcıbadem Mehmet Ali Aydınlar Üniversitesi

    Biyoistatistik ve Tıp Bilişimi Ana Bilim Dalı

    PROF. DR. OSMAN UĞUR SEZERMAN