Geri Dön

Predicting novel small inhibitors of SARS-CoV-2: Targeting SARS-CoV-2 spike protein, human ACE2 protein and SARS-CoV-2 NsP16 via molecular docking

SARS-CoV-2 için yeni küçük inhibitör moleküllerin tahmini: Moleküler yanaştırma yöntemiyle SARS-CoV-2 spike proteini, insan ACE2 proteini ve SARS-CoV-2 NsP16 hedeflenmesi

  1. Tez No: 721380
  2. Yazar: ONUR ÖZER
  3. Danışmanlar: DOÇ. DR. MERT GÜR, DR. ÖĞR. ÜYESİ SEFER BADAY
  4. Tez Türü: Yüksek Lisans
  5. Konular: Biyoloji, Biyomühendislik, Biyoteknoloji, Biology, Bioengineering, Biotechnology
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: İngilizce
  9. Üniversite: İstanbul Teknik Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Moleküler Biyoloji-Genetik ve Biyoteknoloji Ana Bilim Dalı
  12. Bilim Dalı: Moleküler Biyoloji-Genetik ve Biyoteknoloji Bilim Dalı
  13. Sayfa Sayısı: 151

Özet

2019 yılında, bilinmeyen kökenli bir virus, Çin'in Wuhan bölgesinde ortaya çıktı ve şiddetli akut solunum yolu sendromu (SARS) koronavirüs olarak isimlendirildi. Dünya Sağlık Örgütü (WHO), bu virüsü 2019 yeni koronavirüsü (2019-nCoV) olarak isimlendirdi ve salgın, küresel pandemi olarak 11 Mart 2020 yılında ilan edildi. Koronavirüsleri, Orthocoronavirinae RNA virüslerinden bir alt aile olmakla birlikte Coronaviridae ailesine and Nidovirales üst kimliğine mensuplardır. Dünya çapında SARS-CoV-2, 308 milyon insanı enfekte etmiş ve 5,49 milyon ölüme yol açarak %1,79 ölüm oranıyla sonuçlanmıştır ki hala daha etkisini göstermeye devam etmektedir. SARS-CoV-2'nin dört ana yapısal ve görevsel proteini, viral zarf (E), spike (S), nükleokapsid (N) ve matrix/zar (M) proteinleridir. Genomu, N proteini tarafından muhafaza edilmektedir. Ana yapısal proteini olan M proteini virüsün zarf adı verilen koruyucu dış duvarını oluşturmakta olan bir transmembran proteinidir. Diğer proteinlerle etkileşerek virüsün oluşmasını, tomurcuklanmasını ve enfeksiyon sonrası hücrelerden salınarak çoğalımını kontrol eder. Lipid-duvarı üzerine gömülü olan E proteinleri de üzerindeki iyon kanalları youlyla virüsün oluşumunu ve pathogenezini kontrol etmektedir. Sahip olduğu pozitif (+) tek zincirli RNA genomu, konak hücrenin RNA yapısına benzerliğinden ötürü konak hücrenin transkripsiyion ve translasyon mekanizmasını kullanarak kendi replikaz geni üretir. Üretilen replikaz geninin kodladığı iki protein, kesilerek yapısal olmayan proteinleri (NSP) oluşturmaktadır. Bu proteinler, konak hücrenin bağışıklık mekanizmasının baskılanmasında, virüs RNAsının replikasyonunda, transkripsiyonunda ve konak hücreden çıkışında görev almaktadır. S proteinleri, homotrimer yapıda olan tip I hücre zarı glikoproteinleridir. S1 ve S2 olmak üzere iki ana kısımdan oluşmaktadır. Üzerlerinde bulunan 22 adet N-glikolizasyon bölgesi, virüstün yapısının korunması, konak hücreyi enfeksiyonu ve S proteinin uygun bir şekilde katlanması için gereklidir. S1 alt kısmında bulunan reseptör bağlanma bölgesi (RBD), iki ana yapısal konformasyona sahiptir. Bunlar aktif olan yukarı ve inakftif olan aşağı konformasyonlarıdır. Reseptöre erişebilir olan yukarı konformasyonu, konak hücrenin ACE2 reseptörünün tanıyarak bağlanır. Bu bağlanma, S1 biriminin virüsün konak hücreye tutunmasını katalize eder. Konak TMPRSS2 gibi hücre peptidazları, S proteinini iki alt birimi olan S1 ve S2'ye ayırır. Bu olay, S2 biriminin aktifleşerek virüsün konak hücre zarı ile füzyonunu ve dolayısıyla hücreye girişini sağlar. NSP proteinlerinden Nsp16, virüs RNA başını sahip olduğu 2'O metiltransferaz aktivitesi aracılığı ile sadenozilmetioninden (SAM) aldığı metil grubu ile metile edererek replikasyonunu ve konak bağışıklık cevabından kaçısını sağlar. Nsp16 aktivitesi için kofaktörü olan Nsp10 ile etkileşimi gereklidir. Moleküler yanaştırma, bilgisayar yöntemleriyle yapılan simülasyon metotları olmakla birlike bu yöntemlerde ligand adı verilen küçük moleküller, protein reseptörler gibi hedef makromoleküllere bağlattırılır. Ligand kütüphaneleri, moleküler yanaştırma araçlarıyla hedef bölgeye uygunlukları için taranır. Taranan aday ligandlar, bağlanma enerjilerine göre puanlanarak sıralanır. Daha negatif bağlanma enerjisine sahip olan ligandlar, daha stabil ligand-protein yapılarının oluşumuna izin verdiklerinden hedef proteine karşı aday küçük inhibitör moleküller olarak düşünülebilir. SARS-CoV-2 içinde son zamanlar birçok sayıda moleküler yanaştırma çalışmaları önemli hedef proteinleri (S protein RBD, ACE2, NSP proteinleri) üzerinde uygulanarak potansiyel inhibitörler keşfedilmiştir. Bu tezde sunulan çalışmalar, SARS-CoV-2'ye karşı inhibitör olarak kullanılabilecek aday küçük moleküllerin tahmini için yapılmıştır. ZINC data bankasından alınan 400.000 ligand; 'yukarı' konformasyonundaki aktif ve tamamiyle glikolize edilmiş S proteinin RBD bölgesine (PDB: 6VSB), insan ACE2 proteinine (PDB: 6VW1) ve Nsp16 proteinine (6W4H) karşı taranmıştır. Küçük molekül ligandların, Spike RBD ve ACE2 etkileşim bölgesine karşı taranıp yanaştırılması, virüsün hücreye girişini engellmek için yapılmıştır. İkincil olarak yapılan Nsp16 proteininin NSP10 aktifleşme bölgesine ve SAM bağlanma cebine ayrı ayrı yapılan yanaştırma hesaplamaları, virüs genomunun konak hücre içinde replikasyonunu önlemek amacıyla yapılmıştır. Ligandlar ve hedef proteinlerin 3 boyutlu yapıları polar hidrojen atomları da eklenerek AutoDock Tools programında hazırlanmıştır. AutoDock Vina kullanılarak, ligandlar S Protein RBD-ACE2, Nsp16-Nsp10 ve Nsp16-SAM bağlanma arayüzlerine gelecek şekilde hedef proteinlere yanaştırılmıştır. Yanaştırılmanın yapıldığı bağlanma kutuları, AutoDock Tools ile belirlenmiş ve bağlanma enerjileri AutoDock Vina aracılığı ile Python üzerinden hesaplanmıştır. Bu metot, 400.000 ligand arasından en iyi bağlanma enerjisine saip 5.000 ligand bulunana kadar tekrarlanmıştır. Bu 5.000 ligand ve hedef proteinler, Schrödinger Meastro'nun LigPrep ve Protein Preparation Wizard modülleri ile bir sonraki bağlanma hesabı için uygun hale getirilmiştir. Daha sonra, Schrödinger Glide XP moleküler yanaştırma programı ile yüksek tutarlılıklı yanaştırma hesaplamalarına tabi tutulmuşlardır ve en iyi bağlanma enerjisine sahip 200 ligand belirlenmiştir. Belirlenen ligandlar, CANVAS programı ile dendritil parmakizi yöntemi ve hiyerarşik kümülendirilme ile kümülendirilmiştir. Her kümeye ait en düşük durum cezasına ve en yüksek bağlanma skoruna sahip moleküller, ait oldukları kümenin temsilcisi olarak seçilerek ileride deneylerde kullanılacak ilaç çeşitliliği artılması hedeflenmiştir. Bulunan ligandlar, ADME/T analizleriyle farmasötikal özellikleri için taranmıştır. Ayrıca, bu ligandlar moleküller arası etkileşimleri açısından incelenerek, bağlandıkları hedef proteinleri arasında hidrojeb bağları ve hidrofobik etkileşimler yapıp yapmadığı belirlenmiştir. Son olarak, en yüksek ilaç benzerliği özelliklerine sahip olan ligandların bağlanma enerjileri, en son olarak Schrödinger Desmond programında OSPL2005 kuvvet alanı ve TIP3P su modeli kullanılarak hesaplanmıştır. AutoDock Vina yanaştırma hesaplamaları, seçilen ligandlar için hedef bölgelerin inhibasyonu için yüksek bağlanma skorları göstermiştir. Ek olarak, iki basamaklı tekrarlanan AutoDock Vina bağlanma hesapları sonuçların tutarlılığını artırmıştır çünkü aynı iki farklı hesaplama arasında ligandlar için benzer bağlanma skorları elde edilmiştir. Schrödinger Suite Glide XP yanaştırma hesaplamaları daha farklı bir aralıkta ve biraz daha düşük olmak üzere bağlanma skorları göstermesine rağmen, bulunan ligandlar Glide XP'nin kendi hesaplama fonksiyonuna standartlarında uygun ve iyi kabul edilebilecek düzeyde optimum bağlanma skorları vermiştir. En iyi bağlanma enerjisine sahip olanların, AutoDock bağlanma hesaplamalarında bulunanlar ile benzerlik gösterdiği de belirlenmiştir. Bu bağlanma hesaplarının tutarlılığını göstermekte olup en iyi skora sahip olan 200 ligandın, potansiyel olarak inhibitor molekül olarak kullanılabileceğine işaret etmektedir. Kümelendirme işlemleri de bulunan yüksek bağlanma skorlu ligandların, deneylerde çeşitlilik artıracak düzeyde olmasını sağlayacak sonuçlar vermiştir. ADME/T analizleri yüksek bağlanma enerjisine sahip en yüksek skorlu ligandlar için optimum aralıklarda farmasötikel değerler vererek, bunların ilaç olarak kullanılabileceği uygunluğunu göstermiştir. Bir sonraki ligand etkileşim analizleri, en yüksek değerli ligandların kullanıldığı takdirde hedeflendikleri bölgeyi bloke edebileceklerini göstermiştir; çünkü ligandlar hedeflendikleri bölgede simülasyonlarda yüksek sayıda hidrojen bağı ve hidrofobik etkileşim oluşturmuştur. Son olarak, moeküler dinamik simülasyonlarında, simülasyon boyunca ligand-hedef protein komplekslerinin stabilitelerinin korunduğu gözlemlenmiştir ki bu, ligandların bağlanma bölgelerinden çıkmadan pozisyonlarını koruyabileceğini öne sürmektedir. Bu çalışmada tahmin edilen küçük-molekül inhibitörler, SARS-CoV-2'ye karşı potensiyel bir savunma ve tedavi aracı olarak ileride kullanılmak üzere laboratuvar deneylerinde test edilebilir.

Özet (Çeviri)

In 2019, a virus with an unknown origin first emerged in Wuhan, China and was identified as a type of severe acute respiratory syndrome (SARS) coronavirus and named 2019 novel coronavirus (2019-nCoV) by World Health Organization (WHO). The virus was later named SARS-CoV-2 and WHO declared the global pandemic on 11 March 2020. Coronaviruses are a subfamily of RNA viruses (Orthocoronavirinae) which belongs to family of Coronaviridae and order of Nidovirales. Worldwide, SARS-CoV-2 has infected 308 million people and caused 5.49 million deaths, resulting in 1.79% mortality rate. Four major structural and functional proteins of SARS-CoV-2 are envelope (E), spike (S), nucleocapsid (N) and matrix/membrane (M) proteins. The genome is protected by N protein. Main structural protein of viral envelope is M protein. It is a transmembrane protein that interacts with other proteins; and mainly regulates viral assembly, budding and release after infection. E proteins are lipid bilayer-embedded proteins that promote assembly and pathogenesis through its ion channels. Given its similarity to mRNA, (+) stranded RNA genome of SARS-CoV-2 directs host transcriptory and translatory machinery to produce its replicase gene which encodes for two proteins which will be cleaved into non-structural proteins called NSPs. NSPs function in host immune response suppression, viral RNA replication-transcription and the host cell exit. S proteins are homotrimeric type I membrane glycoproteins, consisting of two functional domains, which are S1 and S2. 22 N-glycosylation sites on the surface of S protein are required for stabilizing the virus and maintaining its structural integrity, viral interaction with the host cell receptor, ACE-2 and promoting the proper folding of S protein. The receptor-binding domain (RBD) of S1 subunit has two structural conformations which are 'down' conformation (inactive state) and 'up' conformation (active state). Receptor accessible 'up' conformation RBD recognizes and attaches to human cell membrane receptor angiotensin converting enzyme 2 (ACE2). This allows S1 subunit to catalyze viral attachment to the host cell. After initial attachment, host cell peptidases (e.g. transmembrane protease serine 2 [TMPRSS2]) cleave S protein into its two subunits. Lastly, S2 subunit promotes the fusion with the host membrane. Non-structural protein (Nsp16) methylates viral RNA cap using its 2′O-methyltransferase activity, carrying a methyl group from sadenosylmethionine (SAM) onto RNA. This requires the activation of Nsp16 by its cofactor Nsp10. This action promotes replication and also required for immune evasion of SARS-CoV-2. Molecular docking is a computational simulation method in which a ligand (e.g. small molecule, etc.) is bound to a target in a predefined binding pocket (e.g. the binding site of a protein receptor, etc.) to generate a stable complex. A library of ligands is virtually screened and docked onto the target site through molecular docking tools. Scanned candidate ligands are scored and ranked based on their binding affinity to the target site. The ligands with more negative binding energy and higher binding affinity result in the generation of more stable bound complexes. These ligands can be considered promised inhibitory molecules for the target protein activity. There have been many molecular docking studies against SARS-CoV-2 recently, in order to find strong inhibitory small molecules that can be utilized as drugs against SARS-CoV-2. Major targets for SARS-CoV-2 in these studies have mostly focused on S protein RBD, human ACE2, viral main protease and non-structural proteins as they are key players in viral functions. In this thesis, the studies were conducted to propose possible small-molecule inhibitor candidates for the treatment of SARS-CoV-2. 400.000 commercially available small ligands from ZINC database were virtually screened against three major SARS-CoV-2 targets (RBD of 'up' conformation Spike protein in its fully glycosylated form (PDB ID: 6VSB), human ACE2 (PDB ID: 6VW1) and Nsp16 (PDB ID: 6W4H). The docking of small ligands on the Spike RBD and ACE2 interaction surface interface was conducted to predict candidate small inhibitory molecules to block the interaction between these two proteins and thus viral cell entry. Additionally, the same library of small molecules was separately docked on the Nsp16-Nsp10 interaction site to block the full activation of Nsp16 by Nsp10; and SAM binding pocket of Nsp16 to prevent its methylation activity, thus preventing the cell replication. Ligands and proteins were prepared for molecular docking by generating their 3-D structures and adding polar hydrogen atoms using AutoDock Tools. AutoDock Vina was used to perform molecular docking calculations on the binding interfaces of Spike RBD-ACE2, Nsp16-Nsp10 and Nsp16-SAM. Ligands were docked onto grid docking boxes, which were generated based on these sites, by AutoDock Vina using Python to calculate their binding energies and binding affinities. Ligands were scored and ranked based on their binding energy-doking scores. This method was done for a second time to narrow down 400.000 ligands to 5.000 ligands with the highest affinities to their respective targets. These 5.000 ligands and protein targets were then prepared by using LigPrep and Protein Preparation Wizard modules of Schrödinger Suite Maestro. These 5.000 ligands were screened by using extra-precision (XP) docking of Schrödinger Suite Glide XP to predict top 200 ligands with the highest docking scores. Top 200 ligands were clustered by using CANVAS software of Schrödinger Suite. Dendritic fingerprinting and hierarchical clustering were applied. From each cluster, a single ligand with the lowest state penalty and the highest docking score was identified to prevent the resemblance of ligands and increase the ligand variety for future steps. These resulting ligands were screened for their ADME/T (absorption, distribution, metabolism, and excretion/toxicity) properties to define optimum ligands for their possible pharmceutical use. Furthermore, top-docked ligands were analyzed for their intermolecular interactions with their respective targets to see whether they can form strong and desired hydrogen-bonds and hydrophobic interactions at target-binding interfaces. Lastly, top 10 ligands among most drug-like ones were applied to molecular dynamic simulations to calculate binding free energy using OSPL2005 force field and TIP3P water model of Schrödinger Desmond Software. The most stable, high-binding affinity and most drug-like 5 ligands were identified for each target protein. AutoDock Vina docking calculations of ligands resulted in high binding scores, indicating that selected ligands can bind to target proteins with high affinity and potentially inhibit their interactions. Additionally, two-step AutoDock Vina docking calculations increased the accuracy of results by providing consistency as the similar binding scores were calculated for the same ligands between two docking runs. Schrödinger Suite Glide XP docking calculations resulted in a different range of slightly lower docking scores due to the fact that Glide XP utilized its own and more extensive scoring function. Despite these, Glide XP scores showed high or adequate binding affinities -in the standards of Glide XP scoring function- for top-docked ligands which are mostly the same top ones predicted in AutoDock Vina calculations. This indicates that high consistency between all docking calculation steps. Resulting 200 top ligands with highest binding affinities can be considered as potential small inhibitory molecules. Moreover, clustering results indicated that top-docked ligand candidates are different from each other in terms of chemical and structural properties. This diversity enables the increase in the number of molecule options for possible future lab experiments to test. ADME/T analyses showed that top-docked ligands, which are the representative of each cluster, were statistically closer to optimum in terms of drug-likeness since all of their pharmaceutical properties were found to be in desired range. Furthermore, ligand interaction analyses suggested that the use of these ligands can block the binding site of their respective targets as they can antagonistically overlap and bind to the same or similar residues on these binding interfaces with high affinity by forming high number of hydrogen bonds and hydrophobic interactions. Lastly, molecular dynamics simulations on these ligands showed ligand-target complex stability over the course of simulation time, confirming that identified ligands can retain their positions within binding pocket of their respective targets for possible long-time inhibition. Ligands discovered in this study can provide a good insight for the treatment of SARS-CoV-2 by being used as possible inhibitor molecules or drugs.

Benzer Tezler

  1. Novel resistance-free ret tyrosine kinase inhibitor discovery through dynamic structure-based pharmacophore and qsar modeling and virtual screening of ultra large ligand libraries

    Ultra büyük ligand kütüphanelerinin sanal taraması ve dinamik yapı temelli farmakofor ve qsar modellemesi ile yeni rezistans göstermeyen ret tirozin kinaz inhibitörünün keşfi

    EHSAN SAYYAH

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    BiyofizikBahçeşehir Üniversitesi

    Biyomühendislik Ana Bilim Dalı

    PROF. DR. SERDAR DURDAĞI

  2. Sanal tarama ve çok boyutlu moleküler modelleme yöntemleri ile p53-MDM2 potansiyel inhibitörlerinin belirlenmesi

    Identification of p53-MDM2 potential inhibitors with virtual screening and multidimensional molecular modeling methods

    GÜLŞAH AYDIN

    Doktora

    Türkçe

    Türkçe

    2020

    Kimyaİstanbul Teknik Üniversitesi

    Kimya Ana Bilim Dalı

    PROF. DR. MİNE YURTSEVER

    PROF. DR. SERDAR DURDAĞI

  3. Kanser tedavisine yönelik MDM2-p53 eksenini ilaç yeniden konumlandırması ile hedeflemek

    Targeting the MDM2-p53 axis with drug repurposing for cancer treatment

    NAEEM ABDUL GHAFOOR

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    BiyomühendislikMuğla Sıtkı Koçman Üniversitesi

    Moleküler Biyoloji ve Genetik Ana Bilim Dalı

    DOÇ. DR. AYŞEGÜL YILDIZ

  4. A study on RNA and protein effectors of transcription factor activity and gene expression

    Transkripsiyon faktörü aktivitesi ve gen ifadesinde RNA ve protein etkenleri üzerine bir çalışma

    AYŞE DERYA CAVGA

    Doktora

    İngilizce

    İngilizce

    2019

    BiyofizikKoç Üniversitesi

    Kimya ve Biyoloji Mühendisliği Ana Bilim Dalı

    PROF. DR. ZEHRA ÖZLEM KESKİN ÖZKAYA

    PROF. DR. ATTİLA GÜRSOY

  5. HotRegion v2.0: A new method to predict hot regions in protein-protein interfaces

    HotRegion v2.0: Protein-protein etkileşim arayüzlerindeki sıcak bölgeleri tahmin etmek için yeni bir yöntem

    DAMLA ÖVEK

    Yüksek Lisans

    İngilizce

    İngilizce

    2020

    BiyolojiKoç Üniversitesi

    Hesaplamalı Bilimler ve Mühendislik Ana Bilim Dalı

    PROF. DR. ATTİLA GÜRSOY

    PROF. DR. ZEHRA ÖZLEM KESKİN ÖZKAYA