Prediction of protein-protein interactions through sequence based contrastive representation learning method
Sekans tabanlı ayrımsal temsil öğrenmesi yöntemi ile protein-protein etkileşimlerinin tahmini
- Tez No: 831128
- Danışmanlar: DOÇ. DR. GÜLESER KALAYCI DEMİR
- Tez Türü: Yüksek Lisans
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: İngilizce
- Üniversite: Dokuz Eylül Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Biyomedikal Teknolojiler Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 67
Özet
Proteinler, sinyal iletimi yapmak, bağışıklık tepkisi oluşturmak ve metabolik döngüler yaratmak gibi spesifik işlevleri yerine getirmek için fiziko-kimyasal bağlantılar oluşturarak protein-protein etkileşimlerini meydana getirirler. Bu etkileşimler, hastalık mekanizmalarının incelenmesi, ilaç ve tedavi tasarımı gibi uygulamalar için büyük potansiyele sahiptir. Bununla birlikte, protein-protein etkileşimlerini belirlemeye yönelik deneysel yöntemler zaman alıcı, pahalı ve kapsamı sınırlıdır. Bu nedenle, protein-protein etkileşimlerinin tanımlaması ve buna yönelik çalışmaları geliştirmek için hesaplama yöntemlerine ihtiyaç duyulmaktadır. Sunulan çalışmanın amacı, proteinlerin sadece sekans bilgilerini kullanarak protein-protein etkileşimlerini derin öğrenme ağı oluşturarak kestirim yapmaktır. İlk olarak, protein sekansları üç farklı yöntem kullanılarak temsil edilmişlerdir: Binary kodlama, otokovaryans, ve Position Specific Scoring Matrix (PSSM). Daha sonra, proteinprotein etkileşim kestirimi yapmak için evrişimli bir Siyam sinir ağı oluşturulmuştur. Ağ mimarisi, aynı parametreleri paylaşan iki özdeş alt ağdan oluşmaktadır ve protein dizisi çiftleri arasındaki karmaşık modellerin saptanmasını sağlamaktadır. Deneysel sonuçlar, PSSM kodlama yönteminin 0,8407 ile en yüksek tahmin doğruluğunu sağladığını göstermiştir. Farklı kodlama metodolojileri, aynı protein sekansında farklı özellikleri yakaladığından, herbir kodlayıcının Siyam sinir ağından çıkan tahmin değerleri toplanarak bir topluluk öğrenmesi yöntemi kullanılarak, tahmin performansı iyileştirilmiştir. Sonuç olarak, tahmin doğruluğu yüzde 0,8627'ye yükselmiştir. Bu sonuçlara göre, protein-protein etkileşim tahmininin doğruluğunu artırmak için çoklu protein kodlama stratejilerini entegre etmenin etkinliğinin önemli olduğu görülmektedir. Kapsamlı deneysel sonuçlar, önerilen yöntemin protein-protein etkileşim tahmini için etkili, sağlam ve güvenilir bir alternatif yaklaşım olduğunu kanıtlamaktadır
Özet (Çeviri)
Proteins engage in protein-protein interactions (PPIs), forming physicochemical connections in order to carry out specialized functions such as transmission of signals, immune response, and metabolic cycles. These interactions hold great potential for applications in drug development, therapy design, and disease mechanism research. However, experimental methods for identifying PPIs are time-consuming, expensive, and limited in coverage. Therefore, computational methods are required to complement and enhance PPI identification. The presented study was aimed to construct PPI deep learning network utilizing only protein sequence information. Initially, protein sequences were encoded using three distinct methods: Binary Encoding, Autocovariance, and Position Specific Scoring Matrix (PSSM). Subsequently, a convolutional Siamese neural network was implemented to predict PPIs. The network architecture consisted of two duplicate subnetworks that used identical parameters to detect complicated patterns between pairs of protein sequences. The results demonstrated that the PSSM encoding method yielded the highest prediction accuracy, achieving 0.8407. Since different encoding methodologies capture diverse features from the same protein sequence, an ensemble method was proposed to aggregate the outputs of these encoders, thereby improving prediction performance. As a result, the prediction accuracy increased to 0.8627. This highlights the efficacy of integrating multiple encoding strategies to harness their complementary strengths and enhance the accuracy of PPI prediction. The comprehensive experimental results prove that the proposed method is an effective, robust and reliable alternative approach for prediction of PPIs.
Benzer Tezler
- Target-based drug discovery through contrastive learning and latent optimization
Karşılaştırmalı öğrenme ve saklı vektör optimizasyonundan yararlanarak hedef bazlı ilaç keşfi
BURAK CAN KOBAN
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. ARZUCAN ÖZGÜR TÜRKMEN
DOÇ. DR. ELİF ÖZKIRIMLI ÖLMEZ
- Squence-structure relationships in globular proteins
Küresel proteinlerde dizin yapı ilişkisi
MİNE KAPLAN
- From yeast to human: Unraveling sphingolipid metabolism through macroscopic and microscopic analyses
Mayadan insana: Makroskopik ve mikroskopik analizlerle sfingolipid metabolizmasının incelenmesi
FATMA BETÜL KAVUN ÖZBAYRAKTAR
Doktora
İngilizce
2011
BiyomühendislikBoğaziçi ÜniversitesiKimya Mühendisliği Bölümü
PROF. DR. KUTLU Ö. ÜLGEN
- Deepkinzero: Zero-shot learning for predicting kinase phosphorylation sites
Deepkinzero: Kinaz fosforilasyon yerlerinin sıfır örnek öğrenim ile tahmini
IMAN DEZNABI
Yüksek Lisans
İngilizce
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
Assist. Prof. Dr. ABDULLAH ERCÜMENT ÇİÇEK
Assist. Prof. Dr. ÖZNUR TAŞTAN OKAN
- A tool for prediction of protein expression from genetic data
Genetik veriden protein ekspresyonu tahmini için bir araç
SILA GERLEVİK
Yüksek Lisans
İngilizce
2021
BiyoistatistikAcıbadem Mehmet Ali Aydınlar ÜniversitesiBiyoistatistik ve Tıp Bilişimi Ana Bilim Dalı
PROF. DR. OSMAN UĞUR SEZERMAN