Geri Dön

Extracting protein-ligand interactions from the biomedical literature using deep learning approaches

Derin öğrenme yaklaşımları ile biyomedikal literatüründen protein-ligand etkileşimlerini öğrenme

  1. Tez No: 604320
  2. Yazar: ATAKAN YÜKSEL
  3. Danışmanlar: DOÇ. DR. ARZUCAN ÖZGÜR TÜRKMEN, DOÇ. DR. ELİF ÖZKIRIMLI ÖLMEZ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2019
  8. Dil: İngilizce
  9. Üniversite: Boğaziçi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 79

Özet

Protein-ligand etkileşimi canlı organizmalarda çok önemli bir rol oynar, bu nedenle çeşitli disiplinlerden birçok araştırmacının ilgisini çeker. Araştırmacılara istenilen formatta bilgi sağlayan protein-ligand etkileşim veritabanları vardır. Bu veritabanları manuel olarak biyomedikal literatüründen çıkarılmaktadır ancak biyomedikal alandaki yayınların sayısındaki artıştan dolayı bu işlem her geçen gün daha da zorlaşmaktadır, dolayısıyla otomatik olarak protein-ligand etkileşimlerini metinlerden çıkaran bir sisteme ihtiyaç duyulmuştur. Bu tezin amacı bu ihtiyacı derin öğrenme modelleri ile karşılamaktır. Tez, Evrişimli Sinir Ağı (CNN) ve Uzun/Kısa Süreli Belleğin (LSTM) protein-ligand etkileşimi için performans analizini içerir. Ayrıca, farklı verilerin modellerin performansına etkisi bakımından karşılaştırılması da tez kapsamındadır. BioCreative VI ChemProt yarışması için oluşturulan derlemi, modellerimizin eğitimi ve değerlendirilmesi için veri seti olarak seçildi. Kelime temsilleri, mesafe temsilleri, cümle öğelerinin temsilleri ve iç dış başlangıç öbek temsilleri modelde özellik olarak kullanılmaktadır. Grid arama algoritması, deneylerde her model için optimal hiperparametreleri bulmak için uygulanır. En iyi modeller ve girdi gösterimleri geliştirme seti kullanılarak seçilir ve sonra test seti ile değerlendirilir. Test setindeki sonuçlara dayanarak BiLSTM'in her durumda CNN'den daha iyi performans gösterdiği sonucuna vardık.

Özet (Çeviri)

Protein-ligand interactions play crucial roles in living organisms, thus they attract many researchers from various disciplines. There are protein-ligand interaction databases that provide information to researchers in a suitable format. These databases extract the interactions manually from biomedical literature but the extraction process is becoming harder each day because of the increase in the number of biomedical publication, thereby the need for an automated extraction system has arisen. The aim of this thesis is to fulfill this need via deep learning models. This thesis includes performance analysis of cnn and bilstm Networks for the task of protein-ligand interaction extraction. Comparison of features in terms of their effect on the performance of the models is also included in the thesis. The gold standard corpus that is created for BioCreative VI ChemProt task is selected as our dataset for training and evaluation of our models. Word embeddings, distance embeddings, pos tags and iob chunk tags are used as features in the models. The grid search algorithm is applied to find the optimal hyperparameters for each model in the experiments. The best models and input representations are selected via using the development set then they are evaluated on the test set. Based on the results on the test set, we concluded that bilstm performs better than cnn for each evaluated feature setting.

Benzer Tezler

  1. Moleküler imprint sol-jel polimer kaplı kuantum noktaların sentezi ve optik sensör uygulaması

    Synthesis of quantum dots coated with molecularly imprinted sol-gel polymer for application of optical sensor

    TANER ARSLAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Kimyaİstanbul Teknik Üniversitesi

    Kimya Ana Bilim Dalı

    PROF. DR. ORHAN GÜNEY

  2. Perturbation-response and noise dynamics in proteins and representation learning for biomolecular simulations

    Proteinlerde pertürbasyon-tepki ve gürültü dinamiği ve biyomoleküler simülasyonlarda temsil öğrenme

    YASEMİN BOZKURT VAROLGÜNEŞ

    Doktora

    İngilizce

    İngilizce

    2020

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKoç Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. ALPER DEMİR

  3. Cilt bakım ürünlerinin formülasyonunda potansiyel bir bileşen olarak doğal antimikrobiyal peptit üretimi

    Production of natural antimicrobial peptide as a potential ingredient in the formulation of skin care products

    TUĞBA TEKER

    Doktora

    Türkçe

    Türkçe

    2023

    Biyoteknolojiİstanbul Üniversitesi

    Moleküler Biyoloji ve Genetik Ana Bilim Dalı

    PROF. DR. GÜLRUH ALBAYRAK

    PROF. DR. KADİR TURAN

  4. Çay (Camellia sinensis L.) bitkisinden grelin-benzeri immünoreaktif maddelerim izolasyonu, saflaştırılması ve karakterizasyonu

    Isolation, purification and characterization of ghrelin-like immunoreactive substances from tea (Camellia sinensis L.)

    EMİNE ÇİÇEK

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    BiyokimyaSüleyman Demirel Üniversitesi

    Kimya Ana Bilim Dalı

    DOÇ. DR. MUSTAFA CALAPOĞLU

  5. Ratlarda oluşturulan tip 2 diyabet sonrası diş çekim soketlerinin Del-1 ve IL-17 proteinleri açısından immunohistokimyasal olarak değerlendirilmesi ve kemik iyileşmesinin mikro-BT ile incelenmesi

    Immunohistochemical evaluation of the tooth extraction sites in terms of del-1 and IL-17 proteins after experimental type 2 diabetes and investigation of bone healing by micro-CT

    KÜBRA GÜLER

    Diş Hekimliği Uzmanlık

    Türkçe

    Türkçe

    2022

    Diş HekimliğiSivas Cumhuriyet Üniversitesi

    Periodontoloji Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ EMİNE PİRİM GÖRGÜN