Geri Dön

Drug-target affinity prediction using a graph-based approach enriched with molecule words

Molekül kelimeleriyle zenginleştirilmiş ağ çizgesi yaklaşımlı ilaç-protein etkileşimi tahmini

  1. Tez No: 831879
  2. Yazar: CANSU DAMLA YILMAZ
  3. Danışmanlar: DOÇ. DR. ARZUCAN ÖZGÜR TÜRKMEN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: İngilizce
  9. Üniversite: Boğaziçi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 62

Özet

İlaç-protein etkileşimi tahmini için yapılan fiziksel deneyler pahalı olduğundan ve önemli ölçüde zaman gerektirdiğinden hesaplamalı yöntemler deneylerin ön aşamaları için alternatif olabilir ve araştırmanın gidişatına kılavuzluk edebilirler. Son zamanlarda moleküllerin temsilini bulmak için doğal dil işleme yöntemlerinin kullanılması yaygınlaştı ve bu yöntemlerle başarılı sonuçlar elde edildi. Biz bu çalışmada protein ve ligantların doğal diller gibi kendilerine özgü dillerinin olduğunu varsayıp, kelime olarak adlandırdığımız küçük anlamlı parçalarının da olduğunu öne sürüyoruz. Protein ve ligantların kelimelerini bir alt kelime belirleme yöntemi yardımıyla protein ve ligantların tek boyutlu dizilimlerini kullanarak elde ediyoruz. Girdiyi heterojen ağ çizgesi olarak gösterip, ağ çizgesindeki dört farklı çeşite (protein, ligant, protein kelimesi, ligant kelimesi düğümleri) sahip her düğümün temsilini öğreniyoruz. Protein ve ligantlar arasındaki bağlanma kuvvetini tahmin etmek için öğrendiğimiz temsilleri tahmin modeline besliyoruz. Sonuç olarak, bilinmeyen protein ve/veya ligantların temsilleri için onların kelimelerinin temsillerinin kullanılmasının, kelimelerin kullanılmadığı duruma göre daha iyi sonuçlar verdiğini gösteriyoruz. Yeni moleküllerin temsillerini öğrenmek için girdi ağ çizgesini tekrar eğitmediğimizden, önceden eğitilmiş kelime temsillerinin daha önce görülmemiş moleküller için kullanılması hesaplama karmaşıklığı açısından da verimlidir.

Özet (Çeviri)

Wet-lab experiments to predict the affinity of drugs for their targets are costly and time consuming. Computational methods can provide an alternative to early stage experiments and guide the research process. Recently, the use of natural language processing techniques to represent molecules has become popular and has led to successful results. In our work, we assume that proteins and ligands, like human languages, have their own languages and that these languages consist of meaningful smaller parts that we call words. We identify protein and ligand words based on their 1D sequences using a subword tokenization method and represent protein-ligand interactions with a heterogeneous graph consisting of four different node types corresponding to proteins, ligands, protein words, and ligand words. A graph-based approach is used to learn embeddings for the nodes in the graph. These embeddings are fed into a deep learning model for predicting protein-ligand binding affinity. We show that using their word embeddings to represent novel proteins and/or ligands not present in the training set improves the results compared to the case where no words are used. Using pre-trained word embeddings for previously unknown molecules is also efficient in terms of complexity, as we do not need to re-train the input graph to learn the embeddings for these new molecules.

Benzer Tezler

  1. Deep learning for prediction of drug-target interaction space and protein functions

    İlaç-hedef protein etkileşim uzayı ve protein fonksiyonlarının tahmini için derin öğrenme

    AHMET SÜREYYA RİFAİOĞLU

    Doktora

    İngilizce

    İngilizce

    2020

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. MEHMET VOLKAN ATALAY

    PROF. DR. RENGÜL ÇETİN ATALAY

  2. Empowering heterogeneous networks for drug-target affinity prediction

    İlaç-hedef bağlılık ilgisi tahmini için heterojen ağları güçlendirme

    SELEN PARLAR ÖZÇELİK

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ARZUCAN ÖZGÜR TÜRKMEN

    DOÇ. DR. ELİF ÖZKIRIMLI ÖLMEZ

  3. Text-based machine learning methodologies for modelling drug-target interactions

    Protein-ilaç etkileşimlerinin metin tabanlı makine öğrenmesi yöntemleri ile modellenmesi

    HAKİME ÖZTÜRK

    Doktora

    İngilizce

    İngilizce

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ARZUCAN ÖZGÜR TÜRKMEN

    DOÇ. DR. ELİF ÖZKIRIMLI ÖLMEZ

  4. Veri madenciliği kullanarak ache enzimiyle etkileşen moleküllerin bağlanma eğiliminin tahmini

    Prediction of binding affinity of molecules interacting with ache enzyme using data mining

    MERVE YENEN

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolNecmettin Erbakan Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ÖZLEM ERDAŞ ÇİÇEK

  5. In silico identification of potential inhibitors targeting n terminal of human replication protein a for cancer therapy

    Kanser tedavisi için insan replikasyon protein a n-terminal bölgesini hedefleyen potansiyel inhibitörlerin in silico tanımlanması

    SÜLEYMAN SELİM ÇINAROĞLU

    Yüksek Lisans

    İngilizce

    İngilizce

    2018

    BiyoteknolojiAcıbadem Mehmet Ali Aydınlar Üniversitesi

    DOÇ. DR. EMEL TİMUÇİN