Geri Dön

Prediction of enzymatic properties of protein sequences based on the enzyme commission nomenclature

Protein sekanslarının enzimatik özelliklerinin enzim komisyonu terminolojisine dayalı tahmini

  1. Tez No: 474961
  2. Yazar: ALPEREN DALKIRAN
  3. Danışmanlar: PROF. DR. MEHMET VOLKAN ATALAY, PROF. DR. RENGÜL ATALAY
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2017
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 94

Özet

Sekanslanan gen sayısı gün geçtikçe katlanarak artmaya devam ederken uzman yardımıyla anlamlandırılan biyomolekül bu işlemin yüksek maliyet gerektirmesinden dolayı sınırlı sayıda kalmaktadır. Gen ürünlerinin özelliklerini tahmin etmek için algoritmaya dayalı yöntemler literatürde önerilmiştir. Enzim Komisyonu (EC) numaralarının tahmini bu alandaki zor bir konudur. Enzimler metabolik yolaklarda önemli rol oynamaktadır ve bu nedenle biyoteknoloji ve biyomedikal uygulamalarında yaygın olarak kullanılmaktadırlar. EC numaraları, katalize ettikleri kimyasal reaksiyonlara dayalı enzimatik fonksiyonların sayısal temsilidir. Laboratuvar ortamında yapılan deneylerin maliyetinin yüksekliği ve çok fazla işgücü gerektirmesinden ötürü, katalik olarak aktif olan proteinlerin EC sınıflandırması ile anlamlandırılması sınırlıdır. Bu nedenle, bu proteinleri EC terminolojisiyle sınıflandırıp anlamlandırmak için algoritmaya dayalı yöntemler önerilmiştir. Bununla birlikte, mevcut araçların performans sonuçları, EC numarası tahmin alanının hala iyileştirilmesi gerektiğini göstermektedir. Bu çalışmada, büyük ölçekli protein kümeleri için tahminler elde etmek için EC numarası tahmini yapan bir araç, ECPred anlatılmaktadır. ECPred'de, dört seviyeli EC anlamladırma sistemi arasındaki işlevsel ilişkileri kullanarak hiyerarşik veri hazırlama ve değerlendirme aşamaları geliştirildi. Yaklaşımımızı mevcut çalışmalardan ayıran başlıca özellikler, bağımsız sınıflandırıcıların bir kombinasyonunun kullanılması ve yeni veri hazırlama ve değerlendirme yöntemlerinin geliştirilmiş olmasıdır. Toplamda, 6 ana, 55 altfamilya, 163 alt-altfamilya ve 634 alt katman EC sınıfı sınıflandırıcısından oluşan 858 EC sınıflandırıcısı eğitilmiştir. Doğrulama veri setlerini kullanarak tüm EC sınıfları için 0.99'luk ortalama F-ölçütü elde edilmiştir. Enzim veya enzim olmayan sınıflandırması, hiyerarşik bir tahmin yaklaşımı ile birlikte ECPred'e dahil edilmiştir. Bildiğimiz kadarıyla, Seviye 0'dan (enzim/enzim-olmayan) başlayıp 4. Seviyeye (alt katman sınıfı) kadar proteinlerin enzimatik fonksiyonunu tahmin eden ilk çalışma budur. Son olarak, ECPred bağımsız test setleri üzerinden diğer benzer araçlarla karşılaştırıldı ve ECPred mevcut araçlardan daha iyi sonuçlar elde etti, ancak sonuçlar iyileştirme için hala çalışma yapılabileceğini göstermektedir.

Özet (Çeviri)

The volume of expert manual annotation of biomolecules is steady due to high costs associated with it, although the number of sequenced genomes continues to grow exponentially. Computational methods have been proposed in order to predict the attributes of gene products. The prediction of Enzyme Commission (EC) numbers is a challenging issue in this area. Enzymes have crucial roles in metabolic pathways, therefore they are widely employed in biotechnological and biomedical applications. EC numbers are numerical representations of enzymatic functions based on chemical reactions that they catalyze. Due to the cost and labor extensiveness of in vitro experiments EC classification annotation of catalytically active proteins are limited. Therefore, computational tools have been proposed to classify these proteins to annotate them with EC nomenclature. However, the performance of existing tools indicates that EC number prediction still requires improvement. Here, we present an EC number prediction tool, ECPred, to obtain predictions for large-scale protein sets. In ECPred, we employed hierarchical data preparation and evaluation steps by utilizing the functional relations among the four levels of EC annotation system. The main features that distinguish our approach from existing studies are the use of a combination of independent classifiers, and novel data preparation and evaluation methods. Totally, 858 EC classifiers are trained which consists of 6 main, 55 subfamily, 163 sub-subfamily and 634 substrate EC class classifiers. The average F-score v value of 0.99 is obtained for all EC classes using the validation datasets. Enzyme or non-enzyme classification is incorporated into ECPred along with a hierarchical prediction approach. To the best of our knowledge, this is the first study that predicts the enzymatic function of proteins starting from Level 0 (enzyme/non-enzyme) going up to Level 4 (substrate class). Finally, ECPred is compared with other similar tools on independent test sets and ECPred obtained better results than existing tools, however, the results show that there is still room for improvement.

Benzer Tezler

  1. Chemical and enzymatic interesterification of tallow with different oils

    Hayvan iç yağının farklı yağlarla enzimatik ve kimyasal olarak interesterifikasyonu

    AYŞE BURCU AKTAŞ

    Doktora

    İngilizce

    İngilizce

    2019

    Gıda Mühendisliğiİzmir Yüksek Teknoloji Enstitüsü

    Gıda Mühendisliği Ana Bilim Dalı

    PROF. DR. FATMA BANU ÖZEN

    DR. ÖĞR. ÜYESİ FAHRİ YEMİŞÇİOĞLU

  2. Production of modified lipid with incorporation of essential amino acids into refined olive pomace oil and its characterization

    Rafine edilmiş pirina yağına esansiyel amino asit bağlayarak modifiye yağ üretilmesi ve karakterizasyonu

    HASENE KESKİN ÇAVDAR

    Doktora

    İngilizce

    İngilizce

    2017

    BiyoteknolojiGaziantep Üniversitesi

    Gıda Mühendisliği Ana Bilim Dalı

    PROF. DR. SİBEL FADILOĞLU

  3. Sülfitin olası nörotoksik etkilerinin öğrenme parametrelerini doğrultusunda incelenmesi

    Effect of sulfite on cognetive function in normal and sulfite oxidase-deficient rats

    VURAL KÜÇÜKATAY

    Doktora

    Türkçe

    Türkçe

    2003

    FizyolojiAkdeniz Üniversitesi

    Fizyoloji Ana Bilim Dalı

    PROF.DR. AYSEL AĞAR

  4. Computational prediction of protein-protein interactions in sphingolipid signaling network

    Sfingolipid sinyal ağındaki protein-protein etkikleşimlerinin hesapsal tahmini

    YASEMEN GÜNGÖRMEZ

    Yüksek Lisans

    İngilizce

    İngilizce

    2010

    BiyoteknolojiBoğaziçi Üniversitesi

    Kimya Mühendisliği Ana Bilim Dalı

    PROF. KUTLU ÖZERGİN ÜLGEN

    YRD. DOÇ. ELİF ÖZKIRIMLI ÖLMEZ

  5. A tool for prediction of protein expression from genetic data

    Genetik veriden protein ekspresyonu tahmini için bir araç

    SILA GERLEVİK

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    BiyoistatistikAcıbadem Mehmet Ali Aydınlar Üniversitesi

    Biyoistatistik ve Tıp Bilişimi Ana Bilim Dalı

    PROF. DR. OSMAN UĞUR SEZERMAN