Geri Dön

Active learning for drug blood-brain barrier permeability prediction

İlaçların kan-beyin bariyeri geçirgenliğini tahmin etmede aktif öğrenme

  1. Tez No: 929556
  2. Yazar: AHMED MOHAMED MAHMOUD ELMOSELHY SALEM
  3. Danışmanlar: DOÇ. DR. ÖZNUR TAŞTAN OKAN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Mühendislik Bilimleri, Computer Engineering and Computer Science and Control, Engineering Sciences
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: İngilizce
  9. Üniversite: Sabancı Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Veri Bilimi Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 106

Özet

Kan-beyin bariyeri (BBB), dolaşım sistemi ile merkezi sinir sistemi (CNS) arasındaki kimyasal transferi düzenleyen, oldukça seçici, yarı geçirgen bir sınırdır. Bir bileşiğin BBB'yi geçip geçemeyeceğini değerlendirmek, beynin içindeki hedeflere ulaşma yeteneğini belirlediği için CNS bozukluklarının tedavisinde ilaç geliştirme açısından kritik öneme sahiptir. Kimyasal uzay çok geniştir ve kimyasal bir bileşiğin BBB geçirgenliğini ölçmek için kullanılan geleneksel yöntemler zaman alıcı ve maliyetlidir. Bununla birlikte, deneysel olarak doğrulanmış geçirgenlik değerlendirmelerine sahip bileşikler için açık veri kümelerinin bulunması sayesinde, BBB geçirgenliği tahminini hızlandırmak için çeşitli makine öğrenimi (ML) modelleri önerilmiştir. Bir makine öğrenimi modelinin, denetimli bir ortamda BBB geçirgenlik durumunu öğrenebilmesi için büyük bir etiketlenmiş örnek havuzuna ihtiyaç vardır. Ancak, etiketlenmiş veri setlerinin boyutu, devasa kimyasal uzay karşısında hala kapsamlı olmaktan uzaktır ve bu durum, geleneksel denetimli pasif öğrenme prosedürlerinin etkinliğini sınırlar. Aktif öğrenme (AL) çerçevesi bu duruma bir alternatif sunar. Aktif öğrenme modelleri, her iterasyonda hangi örneklerin etiketleneceğini stratejik olarak seçerek, pasif öğrenmeye kıyasla daha az etiket talebiyle yüksek doğruluklu sınıflandırıcılar elde eder. Bu tezde, kimyasal bileşiklerin BBB geçirgenliğini tahmin etmek için çeşitli AL stratejilerini inceledik ve bunların makine öğrenimi modellerinin performansı üzerindeki etkilerini karşılaştırdık. Özellikle şu örnekleme stratejilerini inceledik: rastgele örnekleme, belirsizlik temelli örnekleme ve benzemezlik temelli örnekleme. Ek olarak, keşif-yoğunlaştırma ve döngüsel yuvarlak-robin adında iki yeni AL yöntemini önerdik ve uyguladık. Ayrıca, tüm AL yöntemlerini pasif öğrenme yöntemleriyle iki ayrı kurulumda karşılaştırmalı olarak analiz ettik: biri verilerin etiket sınıfına göre katmanlı olarak ayrıldığı bir kurulum, diğeri ise kimyasal bileşiklerin moleküler iskeletlerine dayalı olarak ayrıldığı ve daha zor bir değerlendirme ortamı sunan bir kurulum. Sonuçlarımız, iskelet ayrımı kurulumunun, hem pasif hem de aktif öğrenme paradigmalarında, etiket katmanlı ayrım kurulumuna göre daha düşük performansla sonuçlandığını göstermektedir. Ayrıca, deneylerimiz, uyguladığımız aktif öğrenme yaklaşımlarının, test edilen hemen hemen her performans metriğinde, genellikle yalnızca verilerin %10-65'i etiketlendikten sonra pasif öğrenme performansıyla eşleştiğini ortaya koymuştur. Dahası, önerdiğimiz aktif öğrenme yöntemlerinin sonuçları, döngüsel yuvarlak-robin stratejisinin, katmanlı ayrım kurulumunda diğer aktif öğrenme stratejilerinden daha iyi performans gösterdiğini göstermiştir. Bu, dinamik AL yöntemlerinin, büyük etiketlenmiş veri setlerine duyulan ihtiyacı etkin bir şekilde azaltırken BBB geçirgenliğini tahmin etmede yüksek performansı koruma potansiyelini vurgulamaktadır.

Özet (Çeviri)

The blood-brain barrier (BBB) is a highly selective, semipermeable border that regulates the transfer of chemicals between the circulatory and central nervous systems (CNS). Assessing whether a compound can permeate the BBB is critical in drug development for treating CNS disorders, as it determines the compound's ability to reach targets within the brain. The chemical space is vast, and traditional methods for measuring a chemical compound's BBB permeability are time-consuming and costly. However, with the availability of open datasets for compounds with experimentally verified permeability assessments, several machine learning (ML) models have been proposed to accelerate BBB permeability prediction. A large pool of labeled examples is necessary for a machine learning model to learn BBB permeability status in a supervised setting. Yet, the size of labeled datasets remains far from comprehensive when compared to the immense chemical space, limiting the effectiveness of traditional supervised passive learning procedures. The active learning (AL) framework offers an alternative. Active learners iteratively achieve high-accuracy classifiers with fewer label requests compared to passive learning by strategically selecting which examples to label in each iteration. In this thesis, we explored various AL strategies for predicting the BBB permeability of chemical compounds and compared their effects on the performance of machine learning models. Specifically, we examined the following sampling strategies: random sampling, uncertainty-based sampling, and dissimilarity-based sampling. Additionally, we proposed and implemented two novel AL methods: explore-intensify and round-robin cycle switching. We also performed a comparative analysis of all the AL methods against passive learning in two separate setups: one based on a label-stratified splitting technique and another based on splitting the data by the molecular scaffolds of the chemical compounds, which is a more challenging evaluation setup. Our results show that the scaffold-splitting setup resulted in lower performance compared to the label-stratified setup across both passive and active learning paradigms. Furthermore, our experiments revealed that the active learning approaches we implemented matched the performance of passive learning in nearly every performance metric we tested, typically after labeling only 10-65% of the data, depending on the specific metric. Moreover, the results of our proposed active learning methods demonstrated that the round-robin cycle switching strategy outperformed other active learning strategies in the stratified-split setup. This highlights the potential of dynamic AL methods to efficiently reduce the need for large labeled datasets while maintaining high performance in predicting BBB permeability.

Benzer Tezler

  1. Donepezil yüklü nanopartiküler ilaç taşıyıcı sistemlerin hazırlanması ve in vitro değerlendirilmesi

    Preparation and in vitro evaluation of donepezil loaded nanoparticular drug delivery systems

    SEVDA ŞAHAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    Eczacılık ve FarmakolojiHacettepe Üniversitesi

    Nanoteknoloji ve Nanotıp Ana Bilim Dalı

    PROF. DR. YILMAZ ÇAPAN

  2. Testing the toxicity and effectiveness of new treatment options for alzheimer's disease in a zebrafish brain model of amyloid toxicity

    Alzheımer hastalığı için yeni tedavi seçeneklerinin toksik etkilerinin ve etkinliklerinin amiloid toksisite zebra balığı beyin modelinde test edilmesi

    YUSUF KAAN POYRAZ

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    BiyolojiDokuz Eylül Üniversitesi

    Moleküler Biyoloji ve Genetik Ana Bilim Dalı

    DOÇ. DR. HATİCE GÜNEŞ ÖZHAN

  3. Moleküler haberleşme sistemlerinde alıcı kestirim yöntemleri

    Receiver detection methods on molecular communications systems

    ERGİN ASLAN

    Doktora

    Türkçe

    Türkçe

    2023

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    PROF. DR. MEHMET ERTUĞRUL ÇELEBİ

  4. Deep learning for prediction of drug-target interaction space and protein functions

    İlaç-hedef protein etkileşim uzayı ve protein fonksiyonlarının tahmini için derin öğrenme

    AHMET SÜREYYA RİFAİOĞLU

    Doktora

    İngilizce

    İngilizce

    2020

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. MEHMET VOLKAN ATALAY

    PROF. DR. RENGÜL ÇETİN ATALAY

  5. Development of machine learning models for drug repurposing targeting 18 cancer-related proteins

    18 kanser ilişkili proteini hedefleyen ilaç yeniden konumlandırma için makine öğrenimi modellerinin geliştirilmesi

    SELAHATTİN AKSOY

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMuğla Sıtkı Koçman Üniversitesi

    Biyoenformatik Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ TUĞBA SÜZEK