Geri Dön

Discovery of amino acid compositions and motifs responsible for topological transitions in protein complexes

Protein komplekslerinde topolojik geçişlere sebep olan amino asit yüzdelerinin ve motiflerin keşfi

  1. Tez No: 680379
  2. Yazar: ERHAN EKMEN
  3. Danışmanlar: PROF. DR. CANAN ATILGAN, PROF. DR. ALİ RANA ATILGAN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Biyofizik, Biyomühendislik, Biophysics, Bioengineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2021
  8. Dil: İngilizce
  9. Üniversite: Sabancı Üniversitesi
  10. Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Moleküler Biyoloji-Genetik ve Biyomühendislik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 48

Özet

Proteinlerin yapısal sınıflarının tahmini için amino asit yüzdeleri (AAY), sekansları, yapısal motifleri ve amino asit koordinatları gibi birçok özelliği kullanılmıştır. Bazı çalışmalarda, sadece AAY'sinin α, β, α+β, α/β veya bir proteinin monomer ya da dimer olması gibi yapısal sınıfların tahmininde yeterli olduğu gösterilmiştir. Bu çalışmalar AAY'sinin proteinlerin ikincil ve dördüncül yapı sınıflarına evrimsel etkisi açıkça gösterilmiştir. Bu çalışmada ise, sadece proteinlerin AAY'lerini kullanarak birçok makine öğrenmesi tekniği ile proteinlerin topolojik tercihleri tahmin edilmiştir. İkincil ve dördüncül yapı sınıflarının tahminlerinde AAY'leri kullanılarak, K en yakın komşu algoritması ve destek vektör makineleri ile tahminler yapılmıştır. 5 farklı ikincil yapı sınıflarının (α, β, α+β, α/β, s) tahmininde ortalama 0.65 F1 skoru, heteromerik protein komplekslerini içeren 5 farklı dördüncül yapı sınıfı tahmininde ise ortalama 0.62 F1 skoru çoklu sınıf modeli ile elde edilmiştir. 4 protein içeren komplekslere uyguladığımız sonraki analizlerde, simetrisi yüksek ve ayırt edilebilir olan komplekslerin F1 skoru 0.83'e kadar ulaşmıştır ve bu durum AAY'si gibi basit bir özelliğin proteinlerin dördüncül yapısını ne kadar etkilediğini kanıtlamaktadır. Sonrasında fizik tabanlı bir anlayış elde edebilmek için, ikili alfabe modeli H/P (Hidrofobik/Polar) kullanılarak elde edilen zincirlerden komplekslere ait 10-16 harf uzunluğunda birbirinden farklı tekrarlayan motifler tespit edilmiştir. AAY'leri ve tespit edilen motiflerle oluşturulan zincirlere Dağılıcı Parçacık Dinamiği (DPD) benzetimleri uygulandığında oluşturulan bu zincirlerin birbirinden farklı özgün özellikleri gözlemlenmiştir. AAY'leri dördüncül yapıların oluşumunda önemli olsalar da, sekansların oluşturduğu ve etkileşim yüzeylerinde bulunan hidrofobik kısımların topolojik detayları tanımladığı anlaşılmıştır.

Özet (Çeviri)

Prediction of structural classes of proteins has been pursued using various features of proteins such as amino acid composition (AAC), sequence information, structural motifs, and amino acid coordinates. In some studies, it has been shown that using only AACs is enough to predict structural classes such as α, β, α+β, α/β and being monomer or dimer. These studies implicate the evolutionary impact of AAC for secondary and quaternary structure preferences of proteins. In this study, we use AACs to predict the topological preferences of protein complexes by applying several machine learning models. We used k-Nearest Neighbor and Support Vector Machine (SVM) algorithms utilizing AACs as the only feature for the prediction of secondary and quaternary structural classes of proteins. We successfully predicted the five secondary structural classes (α, β, α+β, α/β, s) of proteins with average F1-score of 0.65, and five different quaternary structural classes of heteromeric protein complexes with average F1-score of 0.62 with a multiclass model. Further analyses of complexes having four subunits have also shown that distinctive complexes which have higher symmetry can be predicted more robustly, up to an F1-score of 0.83, proving how a simple feature of proteins is effective for quaternary structure of the protein complexes. To gain a physics-based understanding of these findings, we modeled the chains at the level of H/P (Hydrophobic/Polar) two-letter alphabet and detected unique 10-16 letter long sequences belonging to different quaternary topologies. We applied coarse-grained Dissipative Particle Dynamics simulations on complexes which have repetitions of these sequences and found associations unique to the sequences, despite having the same AACs. Thus, although the AACs are effective in the formation of quaternary structures, sequences creating special hydrophobic patches at the interface determine the topological details.

Benzer Tezler

  1. Recombinant production and characterization of aquaporin protein isolated from geobacillus thermoleovorans ARTR1 and virgibacillus sp. agtr strains

    Vırgıbacıllus sp. agtr, geobacıllus thermoleovorans ARTR1 suşlarından izole edilen akuaporin proteininin rekombinant üretimi ve karakterizasyonu

    ŞEVVAL UYSALCAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Biyoteknolojiİstanbul Teknik Üniversitesi

    Moleküler Biyoloji-Genetik ve Biyoteknoloji Ana Bilim Dalı

    PROF. DR. NEVİN GÜL KARAGÜLER

    DR. ÖĞR. ÜYESİ NACİYE ESRA ATEŞ GENCELİ

  2. Discovery of novel enzymes using proteomic approaches

    Proteomik yaklaşımlar kullanılarak yeni enzimlerin keşfi

    MERVE ÖZTUĞ KILINÇ

    Doktora

    İngilizce

    İngilizce

    2021

    Biyokimyaİstanbul Teknik Üniversitesi

    Moleküler Biyoloji-Genetik ve Biyoteknoloji Ana Bilim Dalı

    PROF. DR. NEVİN GÜL KARAGÜLER

    DOÇ. DR. MÜSLÜM AKGÖZ

  3. Emerging approaches for non-thermal modification of proteins isolated from de-oiled sunflower cake

    Yağsız ayçiçek küspesinden izole edilen proteinlerin modifikasyonu için yenilikçi ısıl olmayan yöntemler

    BÜŞRA GÜLTEKİN SUBAŞI

    Doktora

    İngilizce

    İngilizce

    2021

    Gıda Mühendisliğiİstanbul Teknik Üniversitesi

    Gıda Mühendisliği Ana Bilim Dalı

    PROF. DR. ESRA ÇAPANOĞLU GÜVEN

  4. Exploration of novel serine protease do-like HtrA from acigöl

    Acıgöl'den yeni serin proteaz do-like HtrA enziminin keşfi

    MERYEM MENEKŞE KILIÇ

    Doktora

    İngilizce

    İngilizce

    2023

    Biyolojiİstanbul Teknik Üniversitesi

    Moleküler Biyoloji-Genetik ve Biyoteknoloji Ana Bilim Dalı

    PROF. DR. NEVİN GÜL KARAGÜLER

    PROF. DR. NURGÜL ÇELİK BALCI

  5. Derin öğrenme ağları kullanılarak protein metal bağlanma yerlerinin analizi

    Analysis of protein metal-binding sites using deep neural networks

    İSMAİL HABERAL

    Doktora

    Türkçe

    Türkçe

    2020

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBaşkent Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. HASAN OĞUL