Geri Dön

Predicting HIV1 drug resistance of reverse transcriptase inhibitors using artificial neural networks

Yapay sinir ağlarını kullanarak ters transkriptaz inhibitörlerinin HIV1 ilaç direncini tahmin etme

  1. Tez No: 810423
  2. Yazar: SÜMEYYE YILMAZ
  3. Danışmanlar: PROF. DR. MURAT SARI, DR. ÖĞR. ÜYESİ HÜSEYİN TUNÇ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Matematik, Mathematics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: İngilizce
  9. Üniversite: Yıldız Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Matematik Ana Bilim Dalı
  12. Bilim Dalı: Matematik Bilim Dalı
  13. Sayfa Sayısı: 104

Özet

HIV, her yıl milyonlarca insanı etkileyen ciddi, kronik ve bulaşıcı bir hastalıktır. Antiretroviral tedavi ile HIV ile ilişkili mortalitedeki azalmaya rağmen, direnç gelişimine bağlı virolojik başarısızlık bir sorun olmaya devam etmektedir. Şu anda HIV/AIDS'i etkili bir şekilde tedavi etmenin önündeki en büyük engel ilaç direncidir. Bu nedenle, yeni ilaçları keşfetmek ve ilaca direnç mekanizmasını anlamak çok önemlidir. Bu amaçla klinikte genotipik ve fenotipik testler sıklıkla kullanılmaktadır. Ancak bu testler önemli bir mali ve zamansal yük oluşturmaktadır. Bu tür zorlukların üstesinden gelmek için kullanılan yöntemlerden biri, mevcut verileri uygun şekilde genelleştiren makine öğrenimi modellerinden yararlanmaktır. Bu çalışmanın amacı, HIV-1 ters transkriptaz (RT) enzimini etkileyen moleküllerin ilaç direnç profillerini tahmin etmek için ilaç-izolat-kat değişimine dayalı yapay sinir ağı (YSA) modelleri oluşturmaktır. RT enzimini etkileyen ilaç grupları, nükleosit ters transkriptaz inhibitörleri (NRTI'ler) ve nükleosit olmayan ters transkriptaz inhibitörleridir (NNRTI'ler). Bu inhibitörlerin birlikte eğitilmesiyle DIF-C adı verilen YSA modelleri, ayrı ayrı eğitilerek DIF adı verilen YSA modelleri üretilmiştir. Stanford HIV ilaç direnci veri tabanından, toplam on inhibitör için toplam 18.036 genotip-fenotip veri noktası elde edilmiştir; bunların 12442'si altı inhibitör içeren NRTI'lardan ve 5594'ü dört inhibitör içeren NNRTI'lerden alınmıştır. Bu çalışma boyunca, oluşturulan her modelde çapraz doğrulama ve topluluk öğrenme kullanılmıştır. Yalnızca mutasyon bilgisi kullanılarak oluşturulan IF modellerinin ortalama $R^2$ değeri 0.667 olarak hesaplanmıştır ve \%95 güven aralığı (GA) [0.537, 0.796] olarak belirlenmiştir. DIF-C modelleri, her iki ilaç grubunun birleştirilmesiyle oluşturulan modeller, ortalama $R^2$ değeri olarak 0.644 (%95 GA: [0.536, 0.754]) elde etmiştir. Öte yandan, NRTI ve NNRTI ilaç sınıflarını ayrı ayrı kullanarak eğitilen DIF modeli ise ortalama $R^2$ değeri olarak 0.684 (\%95 GA: [0.586, 0.782]) elde etmiştir. Bu bulgular, DIF modelinin diğer modellere göre istatistiksel olarak daha anlamlı bir $R^2$ değerine ulaştığını göstermektedir. DIF tabanlı modeller, moleküler bilgiden yararlandıkları için IF modellerinden farklıdır. Yüzlerce izolat için kat değişim direncinin tahmini, ilaç çiftlerinin kapsamlı ve etkili bir şekilde karşılaştırılmasını kolaylaştırmıştır. DIF-C modelleri başarılı bir şekilde on adet inhibitör çifti için ilaç direnci eğilimlerini tahmin etmiş ve ortalama 2D korelasyon katsayısı olarak 0.817'yi (\%95 GA: [0.793, 0.841]) göstermiştir. Benzer şekilde, ayrı olarak eğitilen DIF modelleri altı adet NRTI ve dört adet NNRTI için ilaç direnci eğilimlerini tahmin etmiş ve ortalama 2D korelasyon katsayısı olarak 0.838'i (\%95 GA: [0.814, 0.862]) elde etmiştir. Ek olarak, RTI'lerin sıralı ilişkisini tahmin etmek için bir sınıflandırma problemi formüle edilmiş ve doğruluk, duyarlılık, özgüllük, kesinlik, hatırlama, F1 puanı ve AUC değerleri gibi çeşitli değerlendirme metrikleri hesaplanmıştır. Elde edilen DIF-C ve DIF modelleri, harici veri setinde aynı türden moleküller arasındaki sıralı ilişkileri tahmin etmede yüksek AUC değerleri ve doğruluk göstermiştir. Bu bulgular, geliştirilen YSA modellerinin RTI çiftlerinin ilaç direnci eğilimlerini doğru bir şekilde tahmin etme yeteneğine sahip olduğunu göstermektedir. Bu gözlem, çok çeşitli izolatlar kullanılarak yeni inhibitörlerin test edilmesini kolaylaştırma potansiyeline sahiptir.

Özet (Çeviri)

HIV is a serious, chronic, and contagious disease that affects millions of people every year. Despite the decrease in HIV-related mortality with antiretroviral therapy, virological failure due to the development of resistance continues to be a problem. The biggest obstacle to effectively treating HIV/AIDS at present is drug resistance. Therefore, it is crucial to explore new drugs and understand the drug resistance mechanism. For this purpose, genotypic and phenotypic tests are frequently employed clinically. However, these tests pose a significant financial and temporal burden. One of the methods used to overcome such challenges is to leverage machine learning models that appropriately generalize available data. The aim of this study is to create artificial neural network (ANN) models based on drug-isolate-fold change to predict drug resistance profiles of molecules affecting the HIV-1 reverse transcriptase (RT) enzyme. The drug groups impacting the RT enzyme are nucleoside reverse transcriptase inhibitors (NRTIs) and non-nucleoside reverse transcriptase inhibitors (NNRTIs). ANN models called DIF-C have been obtained by training these inhibitors together, and ANN models called DIF have been produced by training them separately. From the Stanford HIV drug resistance database, a total of 18036 genotype-phenotype data points have been acquired for ten inhibitors in total, 12442 from NRTIs containing six inhibitors and 5594 from NNRTIs containing four inhibitors. Throughout this study, cross-validation and ensemble learning have been utilized in every model created. The mean $R^2$ value of the IF models constructed using only mutation information has been calculated as 0.667, with a 95\% confidence interval (CI) of [0.537, 0.796]. The DIF-C models, which have been created by combining both drug groups, have obtained an average $R^2$ value of 0.644 (95\% CI: [0.536, 0.754]). On the other hand, the DIF model, trained separately using NRTI and NNRTI drug classes, has achieved an average $R^2$ value of 0.684 (95\% CI: [0.586, 0.782]). These findings indicate that the DIF model achieves a more statistically significant $R^2$ value compared to the other models. DIF-based models differ from IF models as they make use of molecular information. The prediction of fold change resistance for hundreds of isolates has facilitated a comprehensive and effective comparison of drug pairs. The DIF-C models have successfully predicted drug resistance tendencies for ten inhibitor pairs, demonstrating a mean 2D correlation coefficient of 0.817 (95\% CI of [0.793, 0.841]). Similarly, the separately trained DIF models have predicted drug resistance tendencies for six NRTIs and four NNRTIs, yielding a mean 2D correlation coefficient of 0.838 (95\% CI [0.814, 0.862]). Additionally, a classification problem has been formulated to estimate the ordinal relationship of the RTIs, and various evaluation metrics such as accuracy, sensitivity, specificity, precision, recall, F1 score, and AUC values have been calculated. The resulting DIF-C and DIF models have demonstrated high AUC values and accuracy in predicting the ranked relationships between molecules from the same strain in the external dataset. The findings indicate that the developed ANN models possess the capability to accurately predict the tendencies of drug resistance for RTI pairs. This observation holds the potential to facilitate the testing of new inhibitors using a diverse range of isolates.

Benzer Tezler

  1. Computational approaches to study drug resistance mechanisms

    İlaç direnç mekanizmaları için işlemsel yaklaşımlar

    ZOYA KHALID

    Doktora

    İngilizce

    İngilizce

    2017

    BiyolojiSabancı Üniversitesi

    Moleküler Biyoloji-Genetik ve Biyomühendislik Ana Bilim Dalı

    Prof. Dr. İSMAİL ÇAKMAK

  2. Ai for drug discovery LSTM-driven drug design using selfies for target-focused de novo generation of HIV-1 protease inhibitor candidates in the treatment of AIDS

    Yapay zeka tabanlı LSTM destekli ilaç tasarımı: AIDS tedavisinde selfıes kullanarak HIV-1 proteaz odaklı inhibitör adaylarının tasarlanması

    M.TALEB ALBRIJAWI

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Biyomühendislikİstanbul Medipol Üniversitesi

    Biyomedikal Mühendisliği ve Biyoenformatik Ana Bilim Dalı

    PROF. DR. REDA ALHAJJ

  3. Native state dynamics and recognition/bending processes in globular proteins

    Globüler proteinlerde doğal hal dinamiği ve tanıma/bağlanma süreçleri

    NEŞE KURT

    Doktora

    İngilizce

    İngilizce

    2002

    KimyaBoğaziçi Üniversitesi

    Kimya Ana Bilim Dalı

    PROF. DR. TÜRKAN HALİLOĞLU

  4. Benzodiazepinon (TIBO) bileşiklerinin HIV-1 inhibitörü olarak CoMCET yöntemi ile 3D-QSAR incelenmesi

    QSAR studies with CoMCET method on benzodiazepinone (TIBO) compounds as HIV-1 inhibitors

    TÜLAY HIZCAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2005

    BiyokimyaErciyes Üniversitesi

    Kimya Ana Bilim Dalı

    PROF.DR. EMİN SARIPINAR

  5. 2-amino-6-arilsülfonil benzonitril bileşiklerinin HIV-1 inhibitörü olarak CoMCET metodu ile QSAR incelenmesi

    QSAR studies with CoMCET method on 2-amino-6-arylsulfonyl benzonitrile compounds as HIV-1 inhibitor

    LALEHAN KULAK

    Yüksek Lisans

    Türkçe

    Türkçe

    2005

    BiyokimyaErciyes Üniversitesi

    Kimya Ana Bilim Dalı

    PROF.DR. EMİN SARIPINAR

    PROF.DR. YAHYA GÜZEL