Geri Dön

Pattern search in pathogenic bacterial proteins for localization and secretory systems

Patojenik bakteriyel proteinlerde salgı sistemleri için örüntüler aranması

  1. Tez No: 415513
  2. Yazar: ORHAN ÖZCAN
  3. Danışmanlar: PROF. DR. GÜLAY ÖZCENGİZ, DOÇ. DR. TOLGA CAN
  4. Tez Türü: Doktora
  5. Konular: Biyoteknoloji, Biotechnology
  6. Anahtar Kelimeler: Bakteriyel hücresel lokalizasyon öngörüsü, Patojenik sekans motif arama (PSMS), Patojenik protein motifleri, Protein sekresyon sistemleri, Protein sekans databazları, Bacterial subcellular localization prediction algorithms, Pathogenic Sequence Motif Search (PSMS), Pathogenic protein motifs, Surfacome, Protein secretion systems, Protein sequence databases
  7. Yıl: 2015
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Biyoteknoloji Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 206

Özet

Bilgisayar temelli bakteriyel protein lokalizasyon (BPL) öngörüsü, proteinlerin fonksiyonları hakkında bilgiler veren çok kullanışlı bir araçtır. Özellikle patojenik proteinlerin hücresel alt lokasyonlarının ve salgılandıkları yolakların anlaşılması, potansiyel ilaç ve aşı hedeflerinin ortaya çıkarılması ve hatta mikroorganizmalar için sensor uygulamalarında kullanılabilecek biyomarkörlerin geliştirilmesi için çok önemlidir. Günümüzde birçok BPL öngörü algoritması ve programı mevcut olmasına rağmen bunların birçoğu olumlu öngörü sayısını azami seviyede tutmak amacıyla hazırlandığından hatalı pozitif sonuçlar vermektedir. Bunun yanısıra, mevcut güncel programlar, örneğin PSORT, prensip olarak her organizma türü için verilen sekansları başarıyla analiz edip hücresel localizasyon öngörüsü yapabilmekte, ancak patojenik sekanslar için genellikle başarısız olmaktadır. Patojenik proteinlerin çoğu bakterinin yüzeyinde lokalize olduğundan, patojene spesifik sekresyon motif tarama algoritmalarına da büyük gereksinim vardır ve bunların temelini oluşturan motifler aynı zamanda bakterilerde protein lokalizasyonu hakkında da bilgi verecektir. Şimdiki çalışmada, patojenik bakteriyel protein sekansları içeren veri kümeleri oluşturulmuş ve seçillmiş 5-18 amino asit uzunluğunda motifler taranarak "Pathogenic Sequence Motif Search (PSMS).isimli yeni bir algoritma geliştirmiştir. Bu algoritma, yüzey proteomu ve sekretom komponentleri öngörüsü için 6 farklı sekresyon yolağına karşılık gelen toplam 52 salgılama ile ilişkili protein kalıbının seçilip kullanılmasını temel almaktadır. Bu kalıpların (i) salgılanan, (ii) immünoreaktif ve patentli aşı komponentleri, (iii) sitoplazmik ve (iv) orfan-salgılanan protein grupları için oluşturulan veri kümelerinde taranarak başarı oranlarının test edilmesini içeren doğrulama çalışmaları yapılmıştır. Bu veri kümeleri, yukarıda verilen sıraya göre 3241, 1740, 2582 ve 2533 üyeye sahiptir. Salgılanan proteinleri içeren veri kümesinde mevcut 3241 protein sekansı, sırasıyla TISSS, T2SS, T3SS, T4SS, T5SS ve T6SS salgılama sistemlerini temsil eden 954, 668, 381, 770, 221 ve 274 protein sekansının toplamıdır. Daha önceki çalışmalarımızda Bordetella pertussis yüzey proteomu and sekretomundan elde edilen LC-MS bulgularımız da salgılanan protein sekansı veri kümesinde kullanılmıştır. Seçilmiş kalıpların varlığı, örneğin immünoreaktif proteinleri ve aşı komponentlerini içeren veri kümesinde mevcut toplam 1740 proteinden 503'ünde doğrulanmıştır. Sitoplazmik veri kümesi ise uygun olmayan kalıp adaylarını dışlayabilmek amacıyla kullanılmıştır. Validasyon çalışmaları, mevcut 52 kalıptan 43'ünün salgılama sistemleri ile doğrudan ilişkili, geri kalan 9 kalıbın ise salgılanan, ancak salgılamanın spesifik bir sistemi ile ilişkilendirilemeyen proteinleri belirlediğini göstermiştir. Bu kalıpların yardımıyla, daha önce PSORT kullanılarak hücre içi lokalizasyona sahip olduğu gösterilmiş ve bu nedenle ilaç hedefi/aşı adayı olamamış 75 ayrı proteinin aslında hücre yüzeyinde/salgılanan proteinler olduğu başarıyla öngörülmüştür. Patojenik proteinleri yüksek doğrulukla öngören PSMS programı ve bu tip proteinler için immünoreaktivite ve sekresyon sistemleri temelinde oluşturulan verikümeleri ilgili alandaki araştırmacılar için değerli biyoinformatik kaynaklar oluşturacaktır.

Özet (Çeviri)

Computational prediction of bacterial protein localization (BPL) is a very useful tool which provides clues about protein function. For pathogenic proteins in particular, detection of their subcellular location and their secretory pathways have great implications for vaccine and drug design. Cell surface and/or secreted proteins of microbes can also be used as biomarkers for sensor applications. At present, there are numerous BPL prediction algorithms and programs available, however, most of them give false positive results in order to maximize the number of positive predictions. Moreover, state of the art algorithms, specifically PSORT, successfully identify protein localization for every organism from any given sequence information but they usually fail in pathogenic sequences. Because the most of the pathogenic proteins are surface-localized, there is an imminent need for pathogen-specific secretion motif search algorithms as well. These motifs would also provide information on bacterial protein localization. In the present work, we built databases of pathogenic sequences and searched for selected 5 to 18 amino acid long motifs as a new approach, namely Pathogenic Sequence Motif Search (PSMS). The algorithm is based on a total of 52 distinct secretion-associated patterns covering 6 different secretory pathways for the prediction of surface and secreted proteins. The datasets for each of the following groups of proteins were next established for our validation studies which involved the tests for the success rate of these 52 patterns: Secreted, immunoreactive and patented vaccine, cytoplasmic and orphan-secreted with 3241, 1740, 2582 and 2533 members, respectively. A total of 3241 proteins in secreted proteins dataset represented TISSS, T2SS, T3SS, T4SS, T5SS and T6SS systems of secretion with 954, 668, 381, 770, 221 and 274 protein sequences, respectively. Cytoplasmic protein dataset, on the other hand, was used to exclude certain candidate patterns. 43 out of 52 patterns were truly secretion-related, pointing directly to a specific secretion system. Rest 9 patterns were found in secreted proteins though not related to a specific secretion system. Additionaly, LC-MS data formerly obtained in our laboratories from Bordetella pertussis surface proteome and secretome analyses were also included in the secreted protein sequence dataset. The selected patterns were demonstrated for instance in 503 out of a total of 1740 proteins in the immunoreactive protein dataset. With the help of our patterns, 75 proteins which were formerly predicted to have an intracellular localization and mistakenly ruled out as potential drug targets/vaccine candidates were successfully predicted as surface- associated/secreted ones. Besides the development of PSMS program predicting pathogenic sequences with high accuracy, the separate databases constructed in this work with respect to immunoreactivity and distinct secretory pathways are expected to constitute valuable bioinformatics resources for researchers of the field.

Benzer Tezler

  1. Salmonella enterica subsp. enterica serovar Enteritidis'in fenotipik ve moleküler yöntemlerle karakterizasyonu

    Phenetic and molecular methods for characterization of Salmonella enterica subsp. enterica serovar Enteritidis

    SÜMEYRA ACAR

    Doktora

    Türkçe

    Türkçe

    2012

    BiyolojiYüzüncü Yıl Üniversitesi

    Biyoloji Ana Bilim Dalı

    PROF. DR. EKREM ATALAN

  2. Klasik galaktozemi'de GALT geni mutasyon spektrumu ve genotip-fenotip ilişkisinin araştırılması

    The contribution of molecular genetic methods to the diagnosis of classical galactosemia and investigation of genotype-phenotype correlation

    İREM KALAY

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2019

    Genetikİstanbul Üniversitesi

    Tıbbi Genetik Ana Bilim Dalı

    PROF. DR. ZEHRA OYA UYGUNER

    DR. ÇAĞRI GÜLEÇ

  3. Amyotrophic lateral sclerosis in Turkey: Studies on familial and Sporadic ALS using high-throughput genomic technologies

    Türkiye?de amiyotrofik lateral skleroz: Ailesel ve Sporadik ALS?de yüksek-ölçekli genomik yöntemlerin uygulanması

    ASLIHAN ÖZOĞUZ

    Doktora

    İngilizce

    İngilizce

    2010

    BiyolojiBoğaziçi Üniversitesi

    Moleküler Biyoloji ve Genetik Ana Bilim Dalı

    PROF. DR. A. NAZLI BAŞAK

  4. Elma kara lekesi hastalığı etmeni Venturia inaequalis [(Cooke) G. Winter 1875]'in Türkiye izolatlarının moleküler karakterizasyonu ve patojenisitelerinin belirlenmesi

    Apple scab disease caused by Venturia inaequalis [Cooke) G. Winter 1875] Turkey isolates determination of molecular characterization and pathogenicity

    SUAT KAYMAK

    Doktora

    Türkçe

    Türkçe

    2012

    ZiraatSelçuk Üniversitesi

    Bitki Koruma Ana Bilim Dalı

    PROF. DR. NUH BOYRAZ

  5. Klinik yakınmalı olgulardan izole edilen entamoeba histolytica suşlarının zimodem paternleri

    Zymodeme patterns of entamoeba histolytica strains isolated from clinical patients

    SEVİN KIRDAR

    Doktora

    Türkçe

    Türkçe

    1996

    MikrobiyolojiDokuz Eylül Üniversitesi

    PROF.DR. İ. HAKKI BAHAR