Deepkinzero: Zero-shot learning for predicting kinase phosphorylation sites
Deepkinzero: Kinaz fosforilasyon yerlerinin sıfır örnek öğrenim ile tahmini
- Tez No: 518290
- Danışmanlar: Assist. Prof. Dr. ABDULLAH ERCÜMENT ÇİÇEK, Assist. Prof. Dr. ÖZNUR TAŞTAN OKAN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2018
- Dil: İngilizce
- Üniversite: İhsan Doğramacı Bilkent Üniversitesi
- Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 55
Özet
Protein kinazlar, diğer proteinlerin fosforilasyonunu katalize eden büyük bir enzim ailesidir. Protein aktivitesi için moleküler anahtarlar olarak görev yaparlar ve fosforilasyon olayları vasıtasıyla hücre içi sinyal iletimini düzenlerler. Bu sebeple, bir çok hücresel mekanizmada, merkezi bir rol üstlenirler. Öte yandan, kinaz proteinlerinin fonksiyonel bozukluklarının da birçok hastalıkla ilişkili olduğu belirlenmiştir. Hücredeki normal ve arızalı sinyallerin anlaşılması için, fosforilasyon bölgelerinin tanımlanması ve bu bölgelerin fosforilasyonunda hangi kinazların görev aldığının belirlenmesi gerekir. Kütle spektrometresindeki son gelişmeler, fosforilasyon bölgelerinin proteom seviyesinde hızlı bir şekilde tanımlanmasını olanaklı kılmıştır. Alternatif olarak, protein dizisinde fosforilasyon yerlerini tahmin eden birçok hesaplamalı yöntem de mevcuttur. Bir fosforilasyon bölgesi, deneysel ya da hesaplamalı yöntemlerle belirlendikten sonra, bu bölgeyi hangi kinazın fosforile ettiğini belirlemek ise bir sonraki soruyu oluşturur. Fosforilasyon bölgelerini tahminleyen mevcut hesaplamalı metotların bir kısmı, kinaza-özgü tahminler sunsa da bu yöntemler konvensiyonel gözetimli öğrenme tekniklerine dayandıkları için, ancak bir çok fosforilasyon bölgesi bilinen kinazlar için yeni bölgeleri tahminleyebilirler. Bu zamana kadar üzerine eğinilmemiş bir problem ise daha önce fosforile ettiği hiç bir bölge tespit edilmemiş olan kinazlar için tahmin yapabilmektir. Klasik gözetimli tekniklere dayanan yöntemlerinden hiçbiri, bu tür kinazlar için bağlanma bölgelerini öngöremeyecektir. Bu çalışmada, fosforilasyon bilgisi olmayan kinazlar için sıfır-vuruşlu ögrenme yaklaşımına dayanan DeepKinZero'yu sunuyoruz. DeepKinZero fosforilasyon yerinin merkezde olduğu peptit dizisini girdi olarak alır ve çift yönlü tekrarlayan sinir ağı ile bu dizileri bir vektör uzayına yerleştirir. Kinazları da fonksiyonel özelliklerine ve protein dizilerine göre bir vektör uzayına yerleştirilir. Fosforilasyon bölgesinin çok boyutlu uzayda temsili ile kinazların temsili arasında tanımlanmış bir uyumluluk fonksiyonu aracılığıyla, DeepKinZero fosforile ettiği bölgelerin bilindiği kinazlardan bu bölgeleri bilinmeyen kinazlara bilgi aktarır. Hesaplamalı deneylerimiz, DeepKinZero'nun taban modellerine göre doğrulukta 30 kata varan artış sağladığını göstermektedir. DeepKinZero'nun önceden fosforilasyon bölgeleri bilinmeyen kinazların fosforilasyon bölgelerini tahminleyerek, önemli ilaç hedefleri olan ve az çalışılmış bu kinazlar hakkındaki mevcut bilgi birikimini artırmasını bekliyoruz.
Özet (Çeviri)
Protein kinases are a large family of enzymes that catalyze the phosphorylation of other proteins. By acting as molecular switches for protein activity, the phosphorylation events regulate intracellular signal transduction, thereby assuming a central role in a broad range of cellular activities. On the other hand, aberrant kinase function is implicated in many diseases. Understanding the normal and malfunctioning signaling in the cell entails the identification of phosphorylation sites and the characterization of their interactions with kinases. Recent advances in mass spectrometry enable rapid identification of phosphosites at the proteome level. Alternatively, there are many computational models that predict phosphosites in a given input protein sequence. Once a phosphosite is identified, either experimentally or computationally, knowing which kinase would catalyze the phosphorylation on this particular site becomes the next question. Although a subset of available computational methods provides kinase-specific predictions for phosphorylation sites, due to the need for training data in such supervised methods, these tools can provide predictions only for kinases for which a substantial number of the phosphosites are already known. A particular problem that has not received any attention is the prediction of new sites for kinases with few or no a priori known sites. None of the current computational methods which rely on the classical supervised learning settings can predict additional sites for this kinases. We present DeepKinZero, the first zero-shot learning approach, that can predict phosphosites for kinases with no known phosphosite information. DeepKinZero takes a peptide sequence centered at the phosphorylation site and learns the embeddings of these phosphosite sequences via a bi-directional recurrent neural network, whereas kinase embeddings are based on protein sequence vector representations and the taxonomy of kinases based on their functional properties. Through a compatibility function that associates the representations of the site sequences and the kinases, DeepKinZero transfers knowledge from kinases with many known sites to those kinases with no known sites. Our computational experiments show that DeepKinZero achieves a 30-fold increase in accuracy compared to baseline models. DeepKinZero complements existing approaches by expanding the knowledge of kinases through mapping of the phosphorylation sites pertaining to understudied kinases with no prior information, which are increasingly investigated as novel drug targets.
Benzer Tezler
- Improving deepkinzero with protein languages models and transductive learning
Protein dil modelleri ve transdüktif öğrenme ile deepkinzero'yu iyileştirme
EMİNE AYŞE SUNAR
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSabancı ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. ÖZNUR TAŞTAN OKAN
DOÇ. RAMAZAN GÖKBERK CİNBİŞ