A data-centric approach for investigation of protein-protein interfaces in Protein Data Bank
Protein Veri Bankası'nda bulunan protein-protein ara yüzlerinin incelenmesinde veri odaklı bir yaklaşım
- Tez No: 666540
- Danışmanlar: PROF. DR. ZEHRA ÖZLEM KESKİN ÖZKAYA, PROF. DR. ATTİLA GÜRSOY
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Biyoloji, Computer Engineering and Computer Science and Control, Biology
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2021
- Dil: İngilizce
- Üniversite: Koç Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Veri Bilimi Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 93
Özet
Protein arayüzlerinin yapısal mimarisini anlamak, proteinlerin nasıl etkileşime girdiği ve fonksiyonlarını nasıl yerine getirdiğini anlamak için oldukça önemlidir. Protein-protein arayüzleri, ilaç keşfi ve yeniden konumlandırma çalışmaları için önemli hedefler olabilir; bu ancak mevcut yapısal verilerin anlamlandırılabilmesiyle mümkündür. Deneysel tekniklerdeki gelişmeler, daha büyük ve daha karmaşık protein yapılarının tespit edilmesini mümkün kılmaktadır. Bu araçlar daha erişilebilir hale geldikçe, PVB'de saklanan protein yapılarının sayısı da hızla artmaktadır. Protein komplekslerinin boyutundaki ve verilerin sayısındaki bu artış, protein etkileşimlerini anlamak için paha biçilmez bir araçtır; ancak bu veri bir takım hesaplamalı zorlukları beraberinde getirmektedir. Bu çalışma, öncelikle protein-protein arayüzlerini belirlemeye ve PVB'de bulunan yapı boyutlarının büyümesinden kaynaklanan ve verinin protein arayüzleri açısından analizinde ortaya çıkan bazı zorlukların çözümü için öneriler sunmaktadır. Bu çalışmada, PVB'de bulunan 169,681 protein yapısını değerlendirdik ve 499,169 protein-protein ara yüzü elde ettik. Benzersiz bir protein arayüzleri seti, tüm arayüzlerin yapısal olarak karşılaştırılmasıyla oluşturulabilir. Artan arayüz yapısı, tüm arayüz yapılarını makul bir zaman çerçevesinde karşılaştırmayı neredeyse imkansız kılmaktadır. Bu nedenle, karşılaştırma sayısını yapısal bilgileri kaybetmeden değerlendirilebilir bir aralığa getirebilmek için hesaplamalı çözümlere ihtiyaç vardır. Bu çalışmanın ikinci bölümü, protein sekans ve yapı bilgileri kullanılarak oldukça benzer proteinleri filtrelemek için kullanılabilecek bir yöntem sunmaktadır. Bu süreç sonucunda sıra ve yapı bakımından benzersiz 331.231 arayüz belirledik. Bu filtreleme sonucunda gereken karşılaştırma sayısı, herhangi bir yapısal bilgi kaybetmeden, 2,3 kat azalmıştır. Bu tekniklerin uygulanması, büyük veri kümeleri için protein arayüz karşılaştırması üzerine gelecekte yapılması planlanan çalışmaları mümkün kılabilir.
Özet (Çeviri)
Understanding the structural architecture of protein interfaces is one of the key challenges in explaining how proteins interact and function. Protein-protein interfaces can be important targets for drug discovery and repurposing studies; this is only possible if the structural data available can be utilized in a meaningful way. Advancements in experimental techniques make it possible for scientists to determine larger and more complex protein structures. As these tools are becoming more accessible, the number of protein structures deposited in PDB is also increasing rapidly. This increase in the size of the protein complexes and the size of the data is an invaluable tool for understanding protein interactions. Still, it does not come without its computational challenges. This study first focuses on identifying protein-protein interfaces and overcoming some of the difficulties rooting from growing structure sizes in PDB. We evaluated 169,681 available protein structures in PDB and extracted 499,169 protein-protein interfaces. A unique set of protein interfaces can only be created by structural comparison of interfaces. The increasing number of interface structures makes it almost impossible to compare all interface structures in a reasonable time frame. Therefore, computational solutions are needed to reduce the comparison number within a manageable range without losing structural information. The second part of this study explains an approach for filtering highly similar proteins using sequential and structural information. As a result of this process, we identified 331,231 interfaces, unique in terms of sequence and structure. The reduced number of interfaces results in almost a 2.3-fold reduction in the number of comparisons needed, without losing any structural information. Implementing these techniques can make future studies on protein interface comparison possible for large data sets.
Benzer Tezler
- Stores in an omnichannel world: Understanding their role and improving their performance
Çok kanallı dünyada mağazaların rollerini anlama ve performanslarını iyileştirme üzerine
AYŞE ÇETİNEL
Doktora
İngilizce
2024
EkonometriKoç Üniversitesiİşletme Ana Bilim Dalı
PROF. DR. ABDULLAH GÜRHAN KÖK
DOÇ. DR. ROBERT P. ROODERKERK
- Vocabulary development trajectories of an emergent bilingual child: linguistic, instructional, and socio-interactional perspectives in preschool
Çift dillilik gelişim sürecinde olan bir çocuğun kelime gelişimi yörüngeleri: Okul öncesi dönemde dilbilimsel, öğretimsel ve sosyo-etkileşimsel perspektifler
ERSOY ERDEMİR
Doktora
İngilizce
2013
Eğitim ve ÖğretimState University of New York at BuffaloEğitim Ana Bilim Dalı
PROF. DR. JANINA BRUTT-GRIFFLER
PROF. DR. X. CHRİSTİNE WANG
DOÇ. DR. ERİN KEARNEY
- Heterojen kablosuz ağlar için bulanık mantık dikey el değiştirme algoritması
Fuzzy logic vertical handover algorithm for heterogeneous wireless networks
GÜRKAN COŞKUN
Yüksek Lisans
Türkçe
2017
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. HAKAN ALİ ÇIRPAN
- Strategic planning and its relationship to competitive advantage: A case study of Pınar company
Stratejik planlama ve rekabetçi üstünlük ilişkisi: Pınar şirketi örneği
HADIL HASAN SAIF AL-KHULAIDI
Yüksek Lisans
İngilizce
2023
İşletmeİstanbul Aydın Üniversitesiİşletme (İngilizce) Ana Bilim Dalı
DR. ÖĞR. ÜYESİ BİLGE ÇAĞATAY
- Temsil sonrası görüntü: Mimarlıkta kartografik düşlem
Image after representation: Cartographic paradigm in architecture
DORUK CAN ÖZÇİFÇİ
Doktora
Türkçe
2024
MimarlıkMimar Sinan Güzel Sanatlar ÜniversitesiMimarlık Ana Bilim Dalı
PROF. DR. FATMA ZEYNEP AYGEN