Fast screening algorithms for protein interface structural alignments
Protein arayüzlerinin yapısal hizalamaları için hızlı eleme algoritmaları
- Tez No: 519633
- Danışmanlar: PROF. DR. ATTİLA GÜRSOY, PROF. DR. ZEHRA ÖZLEM KESKİN ÖZKAYA
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2018
- Dil: İngilizce
- Üniversite: Koç Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 107
Özet
Birçok biyolojik işlemin temelini protein-protein etkileşimleri (PPE) oluşturur. PPElerin biyolojik aktivitelerin yerine getirilmesindeki önemi yeni PPElerin tanımlanmasını önemli kılar. Hataya karşı dayanıklı ve güvenilir bilimsel araçlar yeni etkileşimlerin bulunmasını kolaylaştırmak için kullanılabilir. Bilgisayar üzerinden yeni etkileşimlerin bulunmasında en büyük zorluklardan biri arayüzlerden oluşan bir veri kümesinde verilen protein yapısına en uygun arayüzü bulmaktır. Bu tezde, bir veri kümesindeki arayüzleri verilen proteine olan yapısal benzerliklerine göre sıralayan QuickRet algoritmasını sunuyorum. Algoritma arayüzlerden çıkartılan yapısal karakteristik özellikleri verilen proteinden çıkartılan yapısal karakteristik özelliklerle karşılaştırır. QuickRet'i yapısal özelliklerine göre kümelenmiş arayüzlerden oluşan veritabani PIFACE'si ve örnek arayüzleri kullanarak PPE tahmini yapan algoritma PRISM'in tahminlerini kullanarak test ettim. Sonuçlar QuickRet'in verilen proteinler için yapısal olarak benzer arayüzler bulmakta başarılı olduğunu gösteriyor. PIFACE veri kümesinde, QuickRet verilen 166 kümesi üyesinden 56'si için küme temsilcilerini 1. sırada veriyor. PRISM tahminleri içinse, verilen 80 proteinden 56'si için PRISM tarafından tahmin edilen arayüz yapısını %50'lik dilimin içerisinde sıralıyor. QuickRet'e ek olarak, arayüz bölgesini tahmin eden bir derin öğrenme modeli sunuyorum. Model, 3 boyutlu konvolüsyon ağı, verilen yapıyı analiz eder ve verilen yapının arayüz olma olasılığını hesaplar. Model PIFACE, PPI4DOCK, DOCKGROUND'un içinde bulunduğu veri kümelerindeki arayüz yapılarını %80 doğruluk ile tahmin etti.
Özet (Çeviri)
Protein-protein interactions (PPIs) form the basis of many biological processes in living organisms. The significance of PPIs in mediating biological activity necessitates the identification of novel interactions. Template based structural alignment is one of the computational approaches to predict protein-protein interactions using known protein interfaces. One challenge in template-based prediction is the computational cost due to the one-to-all comparison of the query protein against a database of all known interfaces. In this thesis, two different approaches have been developed a) QuickRet, a hashing based algorithm, b) and a deep learning based algorithm. QuickRet, a fast screening algorithm, ranks interfaces due to their structural similarity to a query protein. It extracts features (angles and distances derived from four atoms) from structures of interfaces and compares them with the features extracted from the query protein. QuickRet is tested with the PIFACE database, a clustered protein-protein interface database, and predictions made by the template interface based PPI prediction algorithm, PRISM. The results indicate that QuickRet is successful in filtering structurally dissimilar interfaces for a given protein. With at least 80% match, 99% (320/43500 interface structures remained) of the database is eliminated and the average RMSD value of the remaining structures is 2.4 Å. With at least 90% match, 99.9% (50/43500 structures remained) of the database is eliminated and the average RMSD value drops to 2.28 Å. In addition, a deep learning based method which predicts, for a given protein complex, if the interface between the proteins of the complex is a true interface or not (based on known interfaces in Protein Data Bank). The model, a 3-dimensional convolutional model, analyzes the given structure and outputs the probability of the given structure being an interface. The accuracy of the model for several interface data sets, including PIFACE, PPI4DOCK, DOCKGROUND is approximately 80%. Both algorithms can be used to reduce the computational cost of template-based PPI predictions.
Benzer Tezler
- Multiplexed cell-based diagnostic devices for the detection of kidney disease pathological markers
Böbrek hastalıklarının takibinde kullanılabilir çok katmanlı tüm hücre sensörleri ile oluşturulmuş biyoteşhis cihazları
SILA KÖSE
Yüksek Lisans
İngilizce
2021
Biyomühendislikİhsan Doğramacı Bilkent ÜniversitesiMalzeme Bilimi ve Nanoteknoloji Ana Bilim Dalı
DOÇ. DR. URARTU ÖZGÜR ŞAFAK ŞEKER
- Yapay zeka ve makine öğrenimi ile pankreas tümörlerinin saptanması
Detecting pancreatic tumors with artificial intelligence and machine learning
GÜNEŞ ORAL
Tıpta Uzmanlık
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Üniversitesi-CerrahpaşaGenel Cerrahi Ana Bilim Dalı
PROF. DR. ABDULLAH KAĞAN ZENGİN
- Yere nüfuz eden radar verilerinin işlenmesi ile hedef tespiti
Target detection using ground penetrating datas
DENİZ ÇOLAK
Yüksek Lisans
Türkçe
2018
Elektrik ve Elektronik MühendisliğiBaşkent ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ SELDA GÜNEY
- Machine learning assisted massively parallel crystal structure prediction
Makine öğrenimi destekli paralel kristal yapı tahmini
SAMET DEMİR
Doktora
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiHesaplamalı Bilimler ve Mühendislik Ana Bilim Dalı
PROF. DR. ADEM TEKİN
- Prediction of COVID 19 disease using chest X-ray images based on deep learning
Derin öğrenmeye dayalı göğüs röntgen görüntüleri kullanarak COVID 19 hastalığının tahmini
ISMAEL ABDULLAH MOHAMMED AL-RAWE
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. ADEM TEKEREK