Targeted drug design with warm start
Sıcak başlangıç ile hedef odaklı ilaç tasarımı
- Tez No: 692506
- Danışmanlar: DOÇ. DR. ARZUCAN ÖZGÜR TÜRKMEN, DOÇ. DR. ELİF ÖZKIRIMLI ÖLMEZ
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2021
- Dil: İngilizce
- Üniversite: Boğaziçi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 75
Özet
İlgilenilen bir proteini hedefleyen yeni moleküllerin üretilmesi, farmasötik endüstrisindeki zorlayıcı görevlerdendir. Derin üretici modeller, hedef odaklı molekül tasarımı problemine uygulanmış ve umut verici sonuçlar elde edilmiştir. Fakat, genellikle dayandıkları protein yapısı veya protein-ligand bağlılık ilgisi verilerinin miktarı bu tür modellerin başarısını sınırlamaktadır. Bununla birlikte, büyük miktarlarda etiketlenmemiş protein dizileri ve moleküller mevcuttur ve bu verileri kullanarak faydalı temsiller öğrenen modeller eğitilmiştir. Bu tezde, bu bilgiyi hedef odaklı ilaç tasarımına aktarmak için, önceden eğitilmiş modellerin ağırlıklarını, sıcak başlangıç (warm-start) stratejisi ile hedef odaklı modelleri başlatmak için kullanmayı önerdik. İki sıcak başlangıç stratejisini araştırdık: (i) başlatılan modelin hedeflenen molekül üretimi üzerinde eğitildiği bir aşamalı strateji (ii) moleküler üretim üzerinde bir ön ince ayar ve ardından hedefe özel eğitim içeren iki aşamalı strateji. Molekülleri oluşturmak için kullandığımz iki kod çözme stratejisi ışın araması (beam search) ve örneklemedir (sampling). Sonuçlar, sıcak başlangıçlı modellerin, farklı veri miktarları ve kod çözme stratejilerinde sıfırdan eğitilmiş bir modelden daha iyi performans sergilediğini göstermektedir. Sıcak başlangıç stratejileri, yaygın kullanılan karşılaştırma metrikleri açısından benzer sonuçlar elde etmektedir; bununla birlikte, bir dizi yeni protein için üretilen moleküllerin kenetlenme değerlendirmesi, bir aşamalı stratejinin iki aşamalı stratejiden daha genellenebilir olduğunu önermektedir. Ek olarak, ışın aramasının hem kenetlenme değerlendirmesinde hem de moleküllerin kalitesini değerlendiren kıyaslama ölçütlerinde örneklemeden daha iyi performans gösterdiği gözlemlenmiştir.
Özet (Çeviri)
The generation of novel compounds targeting a protein of interest is a compelling task in the pharmaceutical industry. Deep generative models have been applied to targeted molecular design and have shown promising results. However, such models are often limited by the availability of the data they rely on such as protein structure or protein-ligand binding affinity. Notwithstanding, vast amounts of unlabeled protein sequences and chemical compounds are available and have been used to train models which learn useful representations. To transfer this knowledge to targeted drug design, we propose using warm start strategy to initialize models with those pretrained models. We investigate two warm start strategies: (i) one-stage strategy where the initialized model is trained on targeted molecule generation (ii) two stage strategy containing a pre-finetuning on molecular generation followed by target specific training. We also use two decoding strategies to generate compounds: beam search and sampling. The results show that the warm-started models perform better than a baseline model trained from scratch on different percentages of data and decoding strategies. The proposed warm starting strategies obtain similar results in terms of widely used metrics from benchmarks. However, docking evaluation of the generated compounds for a set of novel proteins suggests that the one stage strategy generalizes better than the two stage strategy. Additionally, we observe that beam search outperforms sampling in both docking evaluation and benchmark metrics assessing the quality of compounds.
Benzer Tezler
- Development of an aprotinin-based novel nano-bioconjugate utilizing microfluidics via 3D cancer spheroid models
3D kanser sferoid modelleri aracılığıyla mikroakışkanlar kullanılarak aprotinin tabanlı yeni bir nano-biyokonjugatın geliştirilmesi
FAIQA NAZIR
Yüksek Lisans
İngilizce
2024
Biyomühendislikİhsan Doğramacı Bilkent ÜniversitesiMalzeme Bilimi ve Nanoteknoloji Mühendisliği Ana Bilim Dalı
DR. GÜRKAN YEŞİLÖZ
DOÇ. DR. AMIRHOUSHANG BAHRAMI
- Interaction of Poly(vinyl alcohol) and chitosan coated iron oxide nanoparticles with cell membrane models
Poli(vinil alkol) ve kitosan kaplı demir oksit nano parçacıklarının hücre zarı modelleri ile etkileşimleri
ARİFE KUŞBAZ
Yüksek Lisans
İngilizce
2018
Bilim ve Teknolojiİstanbul Teknik ÜniversitesiNanobilim ve Nanomühendislik Ana Bilim Dalı
DOÇ. DR. FATMA NEŞE KÖK
DOÇ. DR. SEVİM İŞÇİ TURUTOĞLU
- Computational identification of potential allosteric sites in glucokinase enzyme
Glukokinaz enziminde potansiyel allosterik bölgelerin hesaplamalı olarak belirlenmesi
TUTKU ARSLAN
Yüksek Lisans
İngilizce
2024
Biyomühendislikİzmir Yüksek Teknoloji EnstitüsüBiyomühendislik Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ARZU UYAR
- Determination of species-specific allosteric binding sites in pyruvate kinase and its use in drug design studies
Pirüvat kiraz enziminde türe özgü allosterik bağlanma bölgelerinin belirlenmesi ve ilaç tasarımı çalışmalarında kullanımı
MEHMET FATİH ÖZHELVACI
Yüksek Lisans
İngilizce
2020
Polimer Bilim ve TeknolojisiBoğaziçi ÜniversitesiHesaplamalı Bilimler ve Mühendislik Ana Bilim Dalı
PROF. DR. MEHMET LEVENT KURNAZ
PROF. DR. EBRU DEMET AKDOĞAN
- Altın nanopartiküller ile dekore edilmiş metal organik çerçeve/lipit hibrit yapılarının hazırlanması ve karakterizasyonu
Preparation and characterization of metal-organic framework/lipid hybrid structure decorated with gold nanoparticles
BÜŞRA TOPRAK
Yüksek Lisans
Türkçe
2024
Kimya MühendisliğiHacettepe ÜniversitesiKimya Mühendisliği Ana Bilim Dalı
PROF. DR. NİHAL AYDOĞAN
DR. ÖĞR. ÜYESİ GÖKÇE DİCLE KALAYCIOĞLU