Development of machine learning models for drug repurposing targeting 18 cancer-related proteins
18 kanser ilişkili proteini hedefleyen ilaç yeniden konumlandırma için makine öğrenimi modellerinin geliştirilmesi
- Tez No: 892804
- Danışmanlar: DR. ÖĞR. ÜYESİ TUĞBA SÜZEK
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Biyomühendislik, Computer Engineering and Computer Science and Control, Bioengineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: İngilizce
- Üniversite: Muğla Sıtkı Koçman Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Biyoenformatik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 198
Özet
Kanser, ölümle sonuçlanabilecek bir tehdit oluşturan hastalıktır ve mevcut tedavilerin yetersiz olduğu bir gerçektir. Bu sebeple, yeni ilaçların keşfedilmesi ve etkin bir şekilde kullanılması elzemdir. Ne var ki, yeni ilaçların geliştirilmesi ve kullanıma alınması oldukça maliyetli ve zaman alıcı bir süreçtir. Mevcut ilaçların yeniden konumlandırılması ve yeni aday ilaç kümelerinin oluşturulması için daha optimize edilmiş ve hızlı bir yaklaşıma ihtiyaç vardır. Bu projede, ATM, AXL, BRAF, CREBBP, CTNNB1, EGFR, EPAS1, ERBB2, FLG, FLT3, HDAC4, IDH1, MET, MTOR, PDL1, PIK3CA, RET, TOP2A gibi kanserle ilişkilendirilmiş 18 protein için mevcut ilaçlardan tedavide kullanılabilecek aday ilaç kümesi oluşturuldu. Bunun için PubChem BioAssay kütüphanesinden kanserle ilişkilendirilmiş 18 protein için biyolojik deney sonuçları elde edilmiştir bu sonuçlardan her bir protein için bilinen aktif ve inaktif ilaçlar elde edilmiştir. Bu ilaçları makine öğrenmesi yönteminde kullanmak için PubChem Fingerprint formatına çevrilip makine öğrenmesi yöntemiyle her protein için spesifik modeller oluşturulmuştur. 18 farklı makine öğrenmesi algoritması kullanılarak bu deneyler gerçekleştirilip her protein için en iyi sonucu veren model seçilmiştir. Sonrasında aday ilaç tahmini yapmak için PubChem veri tabanından 110 milyon ilaç kümesi indirilmiştir. Her protein için en iyi model kullanılarak 110 milyonluk PubChem veri tabanı taranıp tahminleme yapılıp aday ilaç kümeleri oluşturmuştur. Oluşturulan aday kümeleri için tahmin skorları hesaplanmış, %99 ve üzeri aktif olması beklenen ilaç kümelerine odaklanılmıştır. Her bir protein için, en yüksek tahmin skoruna sahip 10 ilaç için literatür ve patent taraması yapılmıştır. Yapılan tarama sonucunda, kendi sonuç ve bulgular ile örtüşen her bir protein için aday ilaç listeleri oluşturulmuştur. Sonuç olarak her protein için aktif olarak tahmin edilmiş ve tahmin skorları ile birlikte bir liste oluşturulmuş ve her protein için aday ilaçlar elde edilmiştir.
Özet (Çeviri)
Cancer is a disease that poses a threat that can result in death, and it is a fact that current treatments are inadequate. For this reason, it is essential to discover new drugs and use them effectively. However, the development and introduction of new drugs is a very costly and time-consuming process. A more optimized and rapid approach is needed to reposition existing drugs and generate new sets of candidate drugs. In this project, candidate drugs that can be used in the treatment of 18 proteins associated with cancer such as ATM, AXL, BRAF, CREBBP, CTNNB1, EGFR, EPAS1, ERBB2, FLG, FLT3, HDAC4, IDH1, MET, MTOR, PDL1, PIK3CA, RET, TOP2A are identified. set was created. For this purpose, biological assay results for 18 proteins associated with cancer were obtained from the PubChem Bioassay library. From these results, known active and inactive drugs were obtained for each gene. In order to use these drugs in the machine learning method, PubChem was converted to Fingerprint format and specific models were created for each protein using the machine learning method. These experiments were carried out using 18 different machine learning algorithms and the model that gave the best results for each protein was selected. Afterwards, 110 million drug clusters were downloaded from the PubChem database to make candidate drug predictions. Using the best model for each gene, the 110 million PubChem database was scanned, predictions were made, and candidate drug clusters were created. Prediction scores were calculated for the candidate clusters created, focusing on drug clusters expected to be 99% or more active. For each gene, literature and patent searches were conducted for the 10 drugs with the highest prediction scores. As a result of the screening, candidate drug lists were created for each protein that overlapped with its own results and findings. As a result, each protein was actively predicted and a list was created with prediction scores, and candidate drugs were obtained for each gene.
Benzer Tezler
- Kanser tedavisine yönelik MDM2-p53 eksenini ilaç yeniden konumlandırması ile hedeflemek
Targeting the MDM2-p53 axis with drug repurposing for cancer treatment
NAEEM ABDUL GHAFOOR
Yüksek Lisans
Türkçe
2023
BiyomühendislikMuğla Sıtkı Koçman ÜniversitesiMoleküler Biyoloji ve Genetik Ana Bilim Dalı
DOÇ. DR. AYŞEGÜL YILDIZ
- Efficient optimization algorithms for computational biology
Hesaplamalı biyolojide etkin eniyileme algoritmaları
OĞUZ CAN BİNATLI
Doktora
İngilizce
2024
Endüstri ve Endüstri MühendisliğiKoç ÜniversitesiEndüstri Mühendisliği ve Operasyon Yönetimi
PROF. DR. MEHMET GÖNEN
- Integration and analysis of biological data for computational drug discovery
İşlemsel ilaç keşfi için biyolojik verinin entegrasyonu ve analizi
HEVAL ATAŞ GÜVENİLİR
Doktora
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiSağlık Bilişimi Ana Bilim Dalı
PROF. DR. MEHMET VOLKAN ATALAY
DOÇ. DR. TUNCA DOĞAN
- Computational approaches to study drug resistance mechanisms
İlaç direnç mekanizmaları için işlemsel yaklaşımlar
ZOYA KHALID
Doktora
İngilizce
2017
BiyolojiSabancı ÜniversitesiMoleküler Biyoloji-Genetik ve Biyomühendislik Ana Bilim Dalı
Prof. Dr. İSMAİL ÇAKMAK
- Beş faktör kişilik modeli özelliklerinin uyuşturucu madde bağımlılığı tahmininde makine öğrenmesi kullanımı
The use of machine learning in predicting drug addiction based on big five personality traits
MURAD NAGHIYEV
Yüksek Lisans
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOSTİM TEKNİK ÜNİVERSİTESİYazılım Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ İCLAL ÇETİN TAŞ