Geri Dön

A data-centric approach for investigation of protein-protein interfaces in Protein Data Bank

Protein Veri Bankası'nda bulunan protein-protein ara yüzlerinin incelenmesinde veri odaklı bir yaklaşım

  1. Tez No: 666540
  2. Yazar: ZEYNEP ABALI
  3. Danışmanlar: PROF. DR. ZEHRA ÖZLEM KESKİN ÖZKAYA, PROF. DR. ATTİLA GÜRSOY
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Biyoloji, Computer Engineering and Computer Science and Control, Biology
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2021
  8. Dil: İngilizce
  9. Üniversite: Koç Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Veri Bilimi Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 93

Özet

Protein arayüzlerinin yapısal mimarisini anlamak, proteinlerin nasıl etkileşime girdiği ve fonksiyonlarını nasıl yerine getirdiğini anlamak için oldukça önemlidir. Protein-protein arayüzleri, ilaç keşfi ve yeniden konumlandırma çalışmaları için önemli hedefler olabilir; bu ancak mevcut yapısal verilerin anlamlandırılabilmesiyle mümkündür. Deneysel tekniklerdeki gelişmeler, daha büyük ve daha karmaşık protein yapılarının tespit edilmesini mümkün kılmaktadır. Bu araçlar daha erişilebilir hale geldikçe, PVB'de saklanan protein yapılarının sayısı da hızla artmaktadır. Protein komplekslerinin boyutundaki ve verilerin sayısındaki bu artış, protein etkileşimlerini anlamak için paha biçilmez bir araçtır; ancak bu veri bir takım hesaplamalı zorlukları beraberinde getirmektedir. Bu çalışma, öncelikle protein-protein arayüzlerini belirlemeye ve PVB'de bulunan yapı boyutlarının büyümesinden kaynaklanan ve verinin protein arayüzleri açısından analizinde ortaya çıkan bazı zorlukların çözümü için öneriler sunmaktadır. Bu çalışmada, PVB'de bulunan 169,681 protein yapısını değerlendirdik ve 499,169 protein-protein ara yüzü elde ettik. Benzersiz bir protein arayüzleri seti, tüm arayüzlerin yapısal olarak karşılaştırılmasıyla oluşturulabilir. Artan arayüz yapısı, tüm arayüz yapılarını makul bir zaman çerçevesinde karşılaştırmayı neredeyse imkansız kılmaktadır. Bu nedenle, karşılaştırma sayısını yapısal bilgileri kaybetmeden değerlendirilebilir bir aralığa getirebilmek için hesaplamalı çözümlere ihtiyaç vardır. Bu çalışmanın ikinci bölümü, protein sekans ve yapı bilgileri kullanılarak oldukça benzer proteinleri filtrelemek için kullanılabilecek bir yöntem sunmaktadır. Bu süreç sonucunda sıra ve yapı bakımından benzersiz 331.231 arayüz belirledik. Bu filtreleme sonucunda gereken karşılaştırma sayısı, herhangi bir yapısal bilgi kaybetmeden, 2,3 kat azalmıştır. Bu tekniklerin uygulanması, büyük veri kümeleri için protein arayüz karşılaştırması üzerine gelecekte yapılması planlanan çalışmaları mümkün kılabilir.

Özet (Çeviri)

Understanding the structural architecture of protein interfaces is one of the key challenges in explaining how proteins interact and function. Protein-protein interfaces can be important targets for drug discovery and repurposing studies; this is only possible if the structural data available can be utilized in a meaningful way. Advancements in experimental techniques make it possible for scientists to determine larger and more complex protein structures. As these tools are becoming more accessible, the number of protein structures deposited in PDB is also increasing rapidly. This increase in the size of the protein complexes and the size of the data is an invaluable tool for understanding protein interactions. Still, it does not come without its computational challenges. This study first focuses on identifying protein-protein interfaces and overcoming some of the difficulties rooting from growing structure sizes in PDB. We evaluated 169,681 available protein structures in PDB and extracted 499,169 protein-protein interfaces. A unique set of protein interfaces can only be created by structural comparison of interfaces. The increasing number of interface structures makes it almost impossible to compare all interface structures in a reasonable time frame. Therefore, computational solutions are needed to reduce the comparison number within a manageable range without losing structural information. The second part of this study explains an approach for filtering highly similar proteins using sequential and structural information. As a result of this process, we identified 331,231 interfaces, unique in terms of sequence and structure. The reduced number of interfaces results in almost a 2.3-fold reduction in the number of comparisons needed, without losing any structural information. Implementing these techniques can make future studies on protein interface comparison possible for large data sets.

Benzer Tezler

  1. Stores in an omnichannel world: Understanding their role and improving their performance

    Çok kanallı dünyada mağazaların rollerini anlama ve performanslarını iyileştirme üzerine

    AYŞE ÇETİNEL

    Doktora

    İngilizce

    İngilizce

    2024

    EkonometriKoç Üniversitesi

    İşletme Ana Bilim Dalı

    PROF. DR. ABDULLAH GÜRHAN KÖK

    DOÇ. DR. ROBERT P. ROODERKERK

  2. Vocabulary development trajectories of an emergent bilingual child: linguistic, instructional, and socio-interactional perspectives in preschool

    Çift dillilik gelişim sürecinde olan bir çocuğun kelime gelişimi yörüngeleri: Okul öncesi dönemde dilbilimsel, öğretimsel ve sosyo-etkileşimsel perspektifler

    ERSOY ERDEMİR

    Doktora

    İngilizce

    İngilizce

    2013

    Eğitim ve ÖğretimState University of New York at Buffalo

    Eğitim Ana Bilim Dalı

    PROF. DR. JANINA BRUTT-GRIFFLER

    PROF. DR. X. CHRİSTİNE WANG

    DOÇ. DR. ERİN KEARNEY

  3. Heterojen kablosuz ağlar için bulanık mantık dikey el değiştirme algoritması

    Fuzzy logic vertical handover algorithm for heterogeneous wireless networks

    GÜRKAN COŞKUN

    Yüksek Lisans

    Türkçe

    Türkçe

    2017

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    PROF. DR. HAKAN ALİ ÇIRPAN

  4. Strategic planning and its relationship to competitive advantage: A case study of Pınar company

    Stratejik planlama ve rekabetçi üstünlük ilişkisi: Pınar şirketi örneği

    HADIL HASAN SAIF AL-KHULAIDI

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    İşletmeİstanbul Aydın Üniversitesi

    İşletme (İngilizce) Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ BİLGE ÇAĞATAY

  5. Temsil sonrası görüntü: Mimarlıkta kartografik düşlem

    Image after representation: Cartographic paradigm in architecture

    DORUK CAN ÖZÇİFÇİ

    Doktora

    Türkçe

    Türkçe

    2024

    MimarlıkMimar Sinan Güzel Sanatlar Üniversitesi

    Mimarlık Ana Bilim Dalı

    PROF. DR. FATMA ZEYNEP AYGEN