Extracting protein-ligand interactions from the biomedical literature using deep learning approaches
Derin öğrenme yaklaşımları ile biyomedikal literatüründen protein-ligand etkileşimlerini öğrenme
- Tez No: 604320
- Danışmanlar: DOÇ. DR. ARZUCAN ÖZGÜR TÜRKMEN, DOÇ. DR. ELİF ÖZKIRIMLI ÖLMEZ
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2019
- Dil: İngilizce
- Üniversite: Boğaziçi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 79
Özet
Protein-ligand etkileşimi canlı organizmalarda çok önemli bir rol oynar, bu nedenle çeşitli disiplinlerden birçok araştırmacının ilgisini çeker. Araştırmacılara istenilen formatta bilgi sağlayan protein-ligand etkileşim veritabanları vardır. Bu veritabanları manuel olarak biyomedikal literatüründen çıkarılmaktadır ancak biyomedikal alandaki yayınların sayısındaki artıştan dolayı bu işlem her geçen gün daha da zorlaşmaktadır, dolayısıyla otomatik olarak protein-ligand etkileşimlerini metinlerden çıkaran bir sisteme ihtiyaç duyulmuştur. Bu tezin amacı bu ihtiyacı derin öğrenme modelleri ile karşılamaktır. Tez, Evrişimli Sinir Ağı (CNN) ve Uzun/Kısa Süreli Belleğin (LSTM) protein-ligand etkileşimi için performans analizini içerir. Ayrıca, farklı verilerin modellerin performansına etkisi bakımından karşılaştırılması da tez kapsamındadır. BioCreative VI ChemProt yarışması için oluşturulan derlemi, modellerimizin eğitimi ve değerlendirilmesi için veri seti olarak seçildi. Kelime temsilleri, mesafe temsilleri, cümle öğelerinin temsilleri ve iç dış başlangıç öbek temsilleri modelde özellik olarak kullanılmaktadır. Grid arama algoritması, deneylerde her model için optimal hiperparametreleri bulmak için uygulanır. En iyi modeller ve girdi gösterimleri geliştirme seti kullanılarak seçilir ve sonra test seti ile değerlendirilir. Test setindeki sonuçlara dayanarak BiLSTM'in her durumda CNN'den daha iyi performans gösterdiği sonucuna vardık.
Özet (Çeviri)
Protein-ligand interactions play crucial roles in living organisms, thus they attract many researchers from various disciplines. There are protein-ligand interaction databases that provide information to researchers in a suitable format. These databases extract the interactions manually from biomedical literature but the extraction process is becoming harder each day because of the increase in the number of biomedical publication, thereby the need for an automated extraction system has arisen. The aim of this thesis is to fulfill this need via deep learning models. This thesis includes performance analysis of cnn and bilstm Networks for the task of protein-ligand interaction extraction. Comparison of features in terms of their effect on the performance of the models is also included in the thesis. The gold standard corpus that is created for BioCreative VI ChemProt task is selected as our dataset for training and evaluation of our models. Word embeddings, distance embeddings, pos tags and iob chunk tags are used as features in the models. The grid search algorithm is applied to find the optimal hyperparameters for each model in the experiments. The best models and input representations are selected via using the development set then they are evaluated on the test set. Based on the results on the test set, we concluded that bilstm performs better than cnn for each evaluated feature setting.
Benzer Tezler
- Moleküler imprint sol-jel polimer kaplı kuantum noktaların sentezi ve optik sensör uygulaması
Synthesis of quantum dots coated with molecularly imprinted sol-gel polymer for application of optical sensor
TANER ARSLAN
- Perturbation-response and noise dynamics in proteins and representation learning for biomolecular simulations
Proteinlerde pertürbasyon-tepki ve gürültü dinamiği ve biyomoleküler simülasyonlarda temsil öğrenme
YASEMİN BOZKURT VAROLGÜNEŞ
Doktora
İngilizce
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKoç ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. ALPER DEMİR
- Cilt bakım ürünlerinin formülasyonunda potansiyel bir bileşen olarak doğal antimikrobiyal peptit üretimi
Production of natural antimicrobial peptide as a potential ingredient in the formulation of skin care products
TUĞBA TEKER
Doktora
Türkçe
2023
Biyoteknolojiİstanbul ÜniversitesiMoleküler Biyoloji ve Genetik Ana Bilim Dalı
PROF. DR. GÜLRUH ALBAYRAK
PROF. DR. KADİR TURAN
- Çay (Camellia sinensis L.) bitkisinden grelin-benzeri immünoreaktif maddelerim izolasyonu, saflaştırılması ve karakterizasyonu
Isolation, purification and characterization of ghrelin-like immunoreactive substances from tea (Camellia sinensis L.)
EMİNE ÇİÇEK
Yüksek Lisans
Türkçe
2015
BiyokimyaSüleyman Demirel ÜniversitesiKimya Ana Bilim Dalı
DOÇ. DR. MUSTAFA CALAPOĞLU
- Ratlarda oluşturulan tip 2 diyabet sonrası diş çekim soketlerinin Del-1 ve IL-17 proteinleri açısından immunohistokimyasal olarak değerlendirilmesi ve kemik iyileşmesinin mikro-BT ile incelenmesi
Immunohistochemical evaluation of the tooth extraction sites in terms of del-1 and IL-17 proteins after experimental type 2 diabetes and investigation of bone healing by micro-CT
KÜBRA GÜLER
Diş Hekimliği Uzmanlık
Türkçe
2022
Diş HekimliğiSivas Cumhuriyet ÜniversitesiPeriodontoloji Ana Bilim Dalı
DR. ÖĞR. ÜYESİ EMİNE PİRİM GÖRGÜN