Geri Dön

Critical assessment of the methods and the features used for hot spot prediction at protein-protein interfaces

Protein-protein ara yüzlerindeki sıcak noktaların tahmininde kullanılan metotların ve özelliklerin kritik değerlendirmesi

  1. Tez No: 357211
  2. Yazar: SELİN KARAGÜLLE
  3. Danışmanlar: PROF. DR. ATTİLA GÜRSOY, PROF. DR. ÖZLEM KESKİN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Biyoloji, Computer Engineering and Computer Science and Control, Biology
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2014
  8. Dil: İngilizce
  9. Üniversite: Koç Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Hesaplamalı Bilimler ve Mühendislik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 79

Özet

Sıcak noktalar protein-protein ara yüzlerindeki aminoasitlerin sadece küçük bir alt kümesidir ama bağlanma serbest enerjisine büyük katkı sağlarlar. Sıcak noktalara deneysel olarak karar vermek için aminoasitlerin alanin aminoasidine mutasyonuna bağlı bağlanma serbest enerjilerinin değişimini ölçülür. Eğer aminoasidin mutasyonu bağlanma serbest enerjisinde çok büyük bir değişime yol açıyorsa bu aminoasit sıcak nokta olarak tanımlanır. Sıcak noktalara deneysel olarak karar vermek zaman alıcı, emek yoğundur ve ekonomik maliyeti yüksektir. Bu sebeple, sıcak nokta tahmini için hesaplamalı yöntemler geliştirilmiştir. Bu yöntemler eğitim ve test setleri kullanır. Ancak, sıcak nokta tahmini için standart değerlendirme (benchmark) seti yoktur. Biz hesaplamalı sıcak nokta tahmini için 13 veri setinin birleşiminden oluşan ve 79 protein kompleksinin 1203 aminoasidi için verileri içeren yeni bir değerlendirme veri setini sunuyoruz. Makine öğrenme tabanlı metotlar sıcak nokta tahminleri için sıklıkla kullanılan yöntemlerdir ve bu yöntemlerde çeşitli özellikler birbirleriyle kombine edilirler. Biz literatürü taradık, değişik özellikler topladık ve bu özelliklerin sonuçlar üzerine etkisini eleştirel olarak değerlendirdik. Sonuç olarak güçlü etkisi olan yetmiş özellik tespit edildi. Belirlenen özellikler kullanılarak çeşitli makine öğrenme tabanlı metotların, sunucuların ve bir programın eklentisinin değerlendirme seti üzerindeki performansları kıyaslandı. Sonuçlara göre random forest sınıflayıcı en yüksek kesinliğe (%80) sahiptir ve KFC2_A var olan diğer metotlar arasında en yüksek F-ölçü'süne (0.49) sahip olmasına rağmen naïve Bayes metodunun F-ölçü'sünü geçmez (0.50). Değerlendirme veri seti, güçlü özelliklerin değerleri ve dört sunucunun ve bir eklentinin tahmin sonuçları http://prism.ccbb.ku.edu.tr/hotbase adresinde yer alan HotBase internet ara yüzü aracılığıyla görülebilir ve indirilebilir.

Özet (Çeviri)

Hot spots are only a small subset of protein-protein interface residues but they account for the majority of the binding free energy. Measuring the binding free energy change upon mutating residues to alanine is an experimental way to determine hot spots. If mutation of a residue gives rise to a significantly large change in the binding free energy then this residue is defined as a hot spot. Experimental determination of hot spots is time-consuming, labor intensive and has high economic costs. Therefore, computational methods have been developed for hot spot prediction. These methods use training and testing data sets. However, there are no standard benchmark data sets for hot spot prediction. We present a new benchmark data set that is combination of 13 data sets and includes data of 1203 residues of 79 protein-protein complexes for computational hot spot prediction. The frequently used methods for hot spot prediction are machine-learning based and several features are combined in these methods. We reviewed literature, collected different features and critically assessed the effect of these features on results. As a result, seventy features that have strong effects are determined. The performances of different machine-learning methods, four servers and a plugin for a program using determined features on benchmark data set are compared. The results reveal that random forest classifier has the highest accuracy (80%) and although KFC2_A has the highest F-measure (0.49) among existing methods, but it does not exceed the F-measure of naïve Bayes method (0.50). The benchmark data set, values of powerful features, and prediction results of four servers and a plugin can be viewed and downloaded via HotBase web interface located at http://prism.ccbb.ku.edu.tr/hotbase

Benzer Tezler

  1. Mevcut betonarme bir binanın güçlendirme öncesi ve sonrası deprem güvenliğinin belirlenmesi

    Başlık çevirisi yok

    MERTER GÜRGÜN

    Yüksek Lisans

    Türkçe

    Türkçe

    1998

    İnşaat Mühendisliğiİstanbul Teknik Üniversitesi

    İşletme Ana Bilim Dalı

    PROF. DR. ERKAN ÖZER

  2. Güneş enerji panellerinde harita tabanlı uygunluk analizi

    Map-based suitability analysis for solar energy panels

    FATİH ACAR

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya Üniversitesi

    Bilgisayar ve Bilişim Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ HÜSEYİN ESKİ

  3. Simulation based tool for error propagation analysis of simulink models

    Simülasyon tabanlı araçlar ile simulink modellerinde hata yayılım analizi

    MUSTAFA SARAOĞLU

    Yüksek Lisans

    İngilizce

    İngilizce

    2017

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Kontrol ve Otomasyon Mühendisliği Ana Bilim Dalı

    PROF. DR. MEHMET TURAN SÖYLEMEZ

  4. Sağlık hizmeti tasarımında sezaryen doğum deneyimi üzerinden bütüncül yolculuk haritalama yöntemi önerisi

    Suggestion for a holistic journey mapping method based on the experience of caesarean section in healthcare service design

    HATİCE KÜBRA YILDIZ

    Doktora

    Türkçe

    Türkçe

    2024

    Endüstri Ürünleri Tasarımıİstanbul Teknik Üniversitesi

    Endüstriyel Tasarım Ana Bilim Dalı

    PROF. DR. GÜLNAME TURAN

  5. Random forest classification of tomato fields with planet satellite image data and accuracy assessment

    Planet uydu görüntü verileriyle yüksek doğruluklu domates ürün tipi sınıflandırmasında rastgele orman sınıflandırma yönteminin kullanımı ve doğruluk analizi

    BETÜL ŞALLI

    Yüksek Lisans

    İngilizce

    İngilizce

    2020

    Jeodezi ve Fotogrametriİstanbul Teknik Üniversitesi

    Geomatik Mühendisliği Ana Bilim Dalı

    PROF. DR. AYŞE FİLİZ SUNAR