Predicting HIV1 drug resistance of reverse transcriptase inhibitors using artificial neural networks
Yapay sinir ağlarını kullanarak ters transkriptaz inhibitörlerinin HIV1 ilaç direncini tahmin etme
- Tez No: 810423
- Danışmanlar: PROF. DR. MURAT SARI, DR. ÖĞR. ÜYESİ HÜSEYİN TUNÇ
- Tez Türü: Yüksek Lisans
- Konular: Matematik, Mathematics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: İngilizce
- Üniversite: Yıldız Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Matematik Ana Bilim Dalı
- Bilim Dalı: Matematik Bilim Dalı
- Sayfa Sayısı: 104
Özet
HIV, her yıl milyonlarca insanı etkileyen ciddi, kronik ve bulaşıcı bir hastalıktır. Antiretroviral tedavi ile HIV ile ilişkili mortalitedeki azalmaya rağmen, direnç gelişimine bağlı virolojik başarısızlık bir sorun olmaya devam etmektedir. Şu anda HIV/AIDS'i etkili bir şekilde tedavi etmenin önündeki en büyük engel ilaç direncidir. Bu nedenle, yeni ilaçları keşfetmek ve ilaca direnç mekanizmasını anlamak çok önemlidir. Bu amaçla klinikte genotipik ve fenotipik testler sıklıkla kullanılmaktadır. Ancak bu testler önemli bir mali ve zamansal yük oluşturmaktadır. Bu tür zorlukların üstesinden gelmek için kullanılan yöntemlerden biri, mevcut verileri uygun şekilde genelleştiren makine öğrenimi modellerinden yararlanmaktır. Bu çalışmanın amacı, HIV-1 ters transkriptaz (RT) enzimini etkileyen moleküllerin ilaç direnç profillerini tahmin etmek için ilaç-izolat-kat değişimine dayalı yapay sinir ağı (YSA) modelleri oluşturmaktır. RT enzimini etkileyen ilaç grupları, nükleosit ters transkriptaz inhibitörleri (NRTI'ler) ve nükleosit olmayan ters transkriptaz inhibitörleridir (NNRTI'ler). Bu inhibitörlerin birlikte eğitilmesiyle DIF-C adı verilen YSA modelleri, ayrı ayrı eğitilerek DIF adı verilen YSA modelleri üretilmiştir. Stanford HIV ilaç direnci veri tabanından, toplam on inhibitör için toplam 18.036 genotip-fenotip veri noktası elde edilmiştir; bunların 12442'si altı inhibitör içeren NRTI'lardan ve 5594'ü dört inhibitör içeren NNRTI'lerden alınmıştır. Bu çalışma boyunca, oluşturulan her modelde çapraz doğrulama ve topluluk öğrenme kullanılmıştır. Yalnızca mutasyon bilgisi kullanılarak oluşturulan IF modellerinin ortalama $R^2$ değeri 0.667 olarak hesaplanmıştır ve \%95 güven aralığı (GA) [0.537, 0.796] olarak belirlenmiştir. DIF-C modelleri, her iki ilaç grubunun birleştirilmesiyle oluşturulan modeller, ortalama $R^2$ değeri olarak 0.644 (%95 GA: [0.536, 0.754]) elde etmiştir. Öte yandan, NRTI ve NNRTI ilaç sınıflarını ayrı ayrı kullanarak eğitilen DIF modeli ise ortalama $R^2$ değeri olarak 0.684 (\%95 GA: [0.586, 0.782]) elde etmiştir. Bu bulgular, DIF modelinin diğer modellere göre istatistiksel olarak daha anlamlı bir $R^2$ değerine ulaştığını göstermektedir. DIF tabanlı modeller, moleküler bilgiden yararlandıkları için IF modellerinden farklıdır. Yüzlerce izolat için kat değişim direncinin tahmini, ilaç çiftlerinin kapsamlı ve etkili bir şekilde karşılaştırılmasını kolaylaştırmıştır. DIF-C modelleri başarılı bir şekilde on adet inhibitör çifti için ilaç direnci eğilimlerini tahmin etmiş ve ortalama 2D korelasyon katsayısı olarak 0.817'yi (\%95 GA: [0.793, 0.841]) göstermiştir. Benzer şekilde, ayrı olarak eğitilen DIF modelleri altı adet NRTI ve dört adet NNRTI için ilaç direnci eğilimlerini tahmin etmiş ve ortalama 2D korelasyon katsayısı olarak 0.838'i (\%95 GA: [0.814, 0.862]) elde etmiştir. Ek olarak, RTI'lerin sıralı ilişkisini tahmin etmek için bir sınıflandırma problemi formüle edilmiş ve doğruluk, duyarlılık, özgüllük, kesinlik, hatırlama, F1 puanı ve AUC değerleri gibi çeşitli değerlendirme metrikleri hesaplanmıştır. Elde edilen DIF-C ve DIF modelleri, harici veri setinde aynı türden moleküller arasındaki sıralı ilişkileri tahmin etmede yüksek AUC değerleri ve doğruluk göstermiştir. Bu bulgular, geliştirilen YSA modellerinin RTI çiftlerinin ilaç direnci eğilimlerini doğru bir şekilde tahmin etme yeteneğine sahip olduğunu göstermektedir. Bu gözlem, çok çeşitli izolatlar kullanılarak yeni inhibitörlerin test edilmesini kolaylaştırma potansiyeline sahiptir.
Özet (Çeviri)
HIV is a serious, chronic, and contagious disease that affects millions of people every year. Despite the decrease in HIV-related mortality with antiretroviral therapy, virological failure due to the development of resistance continues to be a problem. The biggest obstacle to effectively treating HIV/AIDS at present is drug resistance. Therefore, it is crucial to explore new drugs and understand the drug resistance mechanism. For this purpose, genotypic and phenotypic tests are frequently employed clinically. However, these tests pose a significant financial and temporal burden. One of the methods used to overcome such challenges is to leverage machine learning models that appropriately generalize available data. The aim of this study is to create artificial neural network (ANN) models based on drug-isolate-fold change to predict drug resistance profiles of molecules affecting the HIV-1 reverse transcriptase (RT) enzyme. The drug groups impacting the RT enzyme are nucleoside reverse transcriptase inhibitors (NRTIs) and non-nucleoside reverse transcriptase inhibitors (NNRTIs). ANN models called DIF-C have been obtained by training these inhibitors together, and ANN models called DIF have been produced by training them separately. From the Stanford HIV drug resistance database, a total of 18036 genotype-phenotype data points have been acquired for ten inhibitors in total, 12442 from NRTIs containing six inhibitors and 5594 from NNRTIs containing four inhibitors. Throughout this study, cross-validation and ensemble learning have been utilized in every model created. The mean $R^2$ value of the IF models constructed using only mutation information has been calculated as 0.667, with a 95\% confidence interval (CI) of [0.537, 0.796]. The DIF-C models, which have been created by combining both drug groups, have obtained an average $R^2$ value of 0.644 (95\% CI: [0.536, 0.754]). On the other hand, the DIF model, trained separately using NRTI and NNRTI drug classes, has achieved an average $R^2$ value of 0.684 (95\% CI: [0.586, 0.782]). These findings indicate that the DIF model achieves a more statistically significant $R^2$ value compared to the other models. DIF-based models differ from IF models as they make use of molecular information. The prediction of fold change resistance for hundreds of isolates has facilitated a comprehensive and effective comparison of drug pairs. The DIF-C models have successfully predicted drug resistance tendencies for ten inhibitor pairs, demonstrating a mean 2D correlation coefficient of 0.817 (95\% CI of [0.793, 0.841]). Similarly, the separately trained DIF models have predicted drug resistance tendencies for six NRTIs and four NNRTIs, yielding a mean 2D correlation coefficient of 0.838 (95\% CI [0.814, 0.862]). Additionally, a classification problem has been formulated to estimate the ordinal relationship of the RTIs, and various evaluation metrics such as accuracy, sensitivity, specificity, precision, recall, F1 score, and AUC values have been calculated. The resulting DIF-C and DIF models have demonstrated high AUC values and accuracy in predicting the ranked relationships between molecules from the same strain in the external dataset. The findings indicate that the developed ANN models possess the capability to accurately predict the tendencies of drug resistance for RTI pairs. This observation holds the potential to facilitate the testing of new inhibitors using a diverse range of isolates.
Benzer Tezler
- Computational approaches to study drug resistance mechanisms
İlaç direnç mekanizmaları için işlemsel yaklaşımlar
ZOYA KHALID
Doktora
İngilizce
2017
BiyolojiSabancı ÜniversitesiMoleküler Biyoloji-Genetik ve Biyomühendislik Ana Bilim Dalı
Prof. Dr. İSMAİL ÇAKMAK
- Ai for drug discovery LSTM-driven drug design using selfies for target-focused de novo generation of HIV-1 protease inhibitor candidates in the treatment of AIDS
Yapay zeka tabanlı LSTM destekli ilaç tasarımı: AIDS tedavisinde selfıes kullanarak HIV-1 proteaz odaklı inhibitör adaylarının tasarlanması
M.TALEB ALBRIJAWI
Yüksek Lisans
İngilizce
2023
Biyomühendislikİstanbul Medipol ÜniversitesiBiyomedikal Mühendisliği ve Biyoenformatik Ana Bilim Dalı
PROF. DR. REDA ALHAJJ
- Native state dynamics and recognition/bending processes in globular proteins
Globüler proteinlerde doğal hal dinamiği ve tanıma/bağlanma süreçleri
NEŞE KURT
- Benzodiazepinon (TIBO) bileşiklerinin HIV-1 inhibitörü olarak CoMCET yöntemi ile 3D-QSAR incelenmesi
QSAR studies with CoMCET method on benzodiazepinone (TIBO) compounds as HIV-1 inhibitors
TÜLAY HIZCAN
- 2-amino-6-arilsülfonil benzonitril bileşiklerinin HIV-1 inhibitörü olarak CoMCET metodu ile QSAR incelenmesi
QSAR studies with CoMCET method on 2-amino-6-arylsulfonyl benzonitrile compounds as HIV-1 inhibitor
LALEHAN KULAK
Yüksek Lisans
Türkçe
2005
BiyokimyaErciyes ÜniversitesiKimya Ana Bilim Dalı
PROF.DR. EMİN SARIPINAR
PROF.DR. YAHYA GÜZEL