Critical assessment of protein-protein interaction databases and features towards prediction of interactions
Etkileşim tahmini için protein-protein etkileşim kümelerinin ve niteliklerin detaylı karşılaştırılması
- Tez No: 246830
- Danışmanlar: DOÇ. DR. ATTİLA GÜRSOY
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Biyoloji, Computer Engineering and Computer Science and Control, Biology
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2009
- Dil: İngilizce
- Üniversite: Koç Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Bölümü
- Bilim Dalı: Elektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı
- Sayfa Sayısı: 87
Özet
Protein-protein etkileşimleri (PPE) biyolojik süreçlerin her seviyesinde çok önemlidir. Deneysel olarak kanıtlanmış PPE farklı veritabanlarına koyulmaktadır. Bu veritabanları PPE hakkında çeşitli bilgiler içermektedir, fakat hücrelerdeki tüm süreçler göz önüne alındığında, kapsamları düşüktür. Bu yüzden, PPE kapsamını genişletmek için güvenilir, daha doğru hesaplamalı metotlar gerekmektedir. Birçok araştırma grubu farklı bilgi ve metotlara dayanan çeşitli doğrulukta PPE tahmin algoritmaları geliştirmiştir. Ancak, yüksek doğrulukta bir PPE tahmin etme metodu geliştirmek ilgi çekicidir.Bu çalışma, var olan dizilim tabanlı PPE tahmin etme metotlarını değerlendirmeyi ve doğruluk oranları geliştirilmiş yeni bir metot önermeyi hedeflemektedir. Tahminler bir makine öğrenimi algoritması olan Destek Vektör Makineleri (DVM) ile yapılmaktadır. DVM, öğrenim etkileşim veri kümelerine göre kalıplar oluşturur ve etkileşimleri bu kalıplar ile tahmin eder. Bu çalışmada, pozitif öğrenim veri kümeleri deneysel PPE'leri, negatif öğrenim veri kümeleri hesaplanmış etkileşmeyen proteinleri içermektedir. Etkileşim bilgisini DVM'de betimlemek için, proteinlerin amino asit dizilim sıralarına göre n-gram frekansları hesaplanmıştır. DVM performansının, öğrenim veri kümelerindeki etkileşimlerden, farklı amino asit sınıflandırması tekniklerinden, n-gram frekanslarından ve ? değerlerinden fazlaca etkilendiği gösterilmiştir. Sekiz öğrenim veri kümesi için DVM kalıpları oluşturulmuştur ve DVM skorları ile detaylı karşılaştırmaları yapılmıştır. Bu skorlara göre, her veri kümesindeki etkileşimleri iyi tahmin eden birleştirilmiş öğrenim veri kümeleri oluşturulur. Daha sonra, en yüksek DVM skorunu elde etmeyi sağlayan en belirleyici nitelikler kümesi bulunur. Son olarak, en iyi DVM kalıpları, YUPE (Yapısal Uyumlu Protein Etkileşimleri) algoritması tarafından tahmin edilen PPE içindeki yanlış pozitiflerin elenmesi için kullanılır.
Özet (Çeviri)
Protein-protein interactions (PPI) are of crucial importance at all levels of biological processes. The experimentally identified PPI are deposited in several databases. These databases contain diverse information about PPI; but their coverage is low when we consider full processes in cells. Thus, reliable, accurate computational methods are needed to improve the coverage. Many research groups have developed PPI prediction algorithms with varying accuracies based on different data and methods. However, to develop a new PPI prediction method with high accuracy is challenging.This study aims to assess existing sequence based PPI prediction methods and to propose a new algorithm with improved accuracies. The predictions are made via Support Vector Machines (SVM), which is a machine learning algorithm. SVM creates models based on training sets and predicts interactions via those models. In this study, positive training sets contain experimental PPI and negative training sets contain computational non-interacting proteins. In order to represent interaction data in SVM, n-gram frequencies of proteins are calculated according to their amino acid sequences. It is shown that SVM performance is strongly affected by interactions in training datasets, amino acid categorization techniques, n-gram frequencies, and ? values used. SVM models are created for eight datasets and the critical assessment of those datasets is made via their SVM scores. Based on those scores, combined training datasets are created that make accurate prediction of interactions in every dataset. Then, the best feature set that leads to the highest SVM scores is found. Finally, the best SVM models are utilized to eliminate false positives in putative protein interactions predicted by PRISM (Protein Interactions by Structural Matching) algorithm.
Benzer Tezler
- Metabolism-oriented multiomics data integration
Farklı omı̇k verı̇lerı̇n metabolı̇zma odaklı entegrasyonu
AYCAN ŞAHİN
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. ALİ ÇAKMAK
- Assessment of PRISM with previous CAPRI rounds
PRISM'in geçmiş CAPRI turları ile değerlendirilmesi
EFE ELBEYLİ
Yüksek Lisans
İngilizce
2017
BiyolojiKoç ÜniversitesiBiyomedikal Bilimler ve Mühendislik Ana Bilim Dalı
PROF. DR. ZEHRA ÖZLEM KESKİN ÖZKAYA
PROF. DR. ATTİLA GÜRSOY
- Siprofloksasin'in tümör dokusunda matriks metalloproteinaz ekspresyonu ile anjiyogenez belirteçler ve inflamatuar süreç üzerine etkilerinin değerlendirilmesi
Assessment of ciprofloxacin effects on matrix metalloproteinase expression with angiogenesis indicator and inflammation process in cancer tissue
ELİF TUĞBA OĞUZ TAYLAN
Tıpta Uzmanlık
Türkçe
2019
OnkolojiTrakya Üniversitesiİç Hastalıkları Ana Bilim Dalı
PROF. DR. SERNAZ UZUNOĞLU
- The functional assessment of fluorecently tagged adenosine a2a and dopamine D2 receptors and qualitative analysis of dimerization of adenosine A2A and dopamine D2 receptor by using fret
Floresan moleküller ile işaretlenmiş adenozin A2A ve dopamin D2 reseptörlerini işlevsel tespiti ve reseptörlerin eşleşmesinin fret analizi ile kantitatif değerlendirilmesi
SELİN AKKUZU
Yüksek Lisans
İngilizce
2013
BiyolojiOrta Doğu Teknik ÜniversitesiBiyoloji Ana Bilim Dalı
DOÇ. DR. ÇAĞDAŞ DEVRİM SON
- Nanomalzemeler kullanılarak üretilen düzplaka membranların ve membran biyoreaktörlerde (MBR) kullanılması ve biyokirlenme davranışları
Fabrication of flat-sheet membranes with using nanomaterials and its applications at membrane bioreactor (MBR) systems and biofouling behaviors
BAHAR TAŞ
Yüksek Lisans
Türkçe
2013
Çevre Mühendisliğiİstanbul Teknik ÜniversitesiÇevre Mühendisliği Ana Bilim Dalı
PROF. DR. İSMAİL KOYUNCU