Prediction of druggability properties of chemicals using machine learning techniques
Makina öğrenmesi tekniklerini kullanarak kimyasalların ilaç olabilirliğinin tahmin edilmesi
- Tez No: 632498
- Danışmanlar: DOÇ. DR. ARZUCAN ÖZGÜR TÜRKMEN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2020
- Dil: İngilizce
- Üniversite: Boğaziçi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
- Sayfa Sayısı: 91
Özet
İlaç keşfi, yeni ilaç tasarlama ve geliştirme sürecidir ancak bu alanda yapılan araştırmalar maliyetlidir ve uzun zaman almaktadır. Piyasada ilaç benzeri bir çok molekül önerilmiş olmasına rağmen, onaylanan ve piyasaya sürülen ilaçların sayısı çok düşüktür, çünkü ilaç aday moleküllerinin çoğu düşük farmakokinetik özelliklere sahiptir. Bu nedenle, ilaç benzeri moleküllerin Emilim, Dağılım, Metabolizma, Boşaltım, Zehirlilik özelliklerinin erken değerlendirilmesi, maliyetli ve başarısız çalışmalardan kaçınılabilinmesi açısından ilaç endüstrisi için oldukça önemlidir. Amacımız, ilaç aday moleküllerinin ilaç olabilme özelliklerini öngören bir yaklaşım ortaya koymak ve ADMET özellikleri ile moleküler tanımlayıcılar arasındaki ilişkileri belirtmektir.\par Bu tez çalışmasında, k en yakın komşu, destek vektör makineleri ve rastgele orman olmak üzere 3 farklı makine öğrenme algoritması kullanarak, moleküllerin ilaç olabilme özelliklerini tahmin etmek için 4 farklı molekül temsilini, 9 ADMET özelliği veri kümesi üzerinde inceleyip karşılaştırıyoruz. Tüm moleküler gösterimler arasında, morgan parmak izinin doğruluk ve F-ölçümü açısından daha iyi performans gösterdiğine, ancak parametre ayarlama ve algoritma eğitim süresinin parmak izi gösterimleri ile daha uzun olduğu sonucuna vardık. Makine öğrenme algoritmaları söz konusu olduğunda, morgan parmak izi kullanılan DVMS, daha yüksek doğruluk ve F-ölçümü göstermektedir. Moleküler tanımlayıcılardan oluşan vektör temsili ile RF sınıflandırıcısını kullanarak her ADMET özelliği için en etkili moleküler tanımlayıcıyı değerlendiriyoruz. Bazı veri kümeleri için, morgan parmak izi temsiline en çok katkıda bulunan tanımlayıcıyı ekleyerek yaptığımız deneylerde değerlendirme metriklerinde artış gözlemekteyiz.
Özet (Çeviri)
Drug discovery is the process of designing and developing new medicine. The research and clinical experiments for new drug proposals are costly and take a long time. Although there has been proposed a lot of drug-like molecules, the number of drugs that are confirmed by regulating bodies and released to the market is very low. That is because most of the drug candidate molecules have low pharmacokinetic properties. Therefore, early assessments of ADMET properties have gained extreme importance for pharmaceutical industry, to be able to avoid costly failures. Here, our aim is to come up with an approach that reliably predicts druggability features of drug candidate molecules as well as to point out the relations between ADMET properties and molecular descriptors. \par In this thesis study, we examine and compare 4 different molecule representations to predict druggability features of molecules, using 3 different machine learning algorithms; namely k-nearest neighbor, support vector machine classifier and random forest on 9 ADMET property datasets. We conclude that among all molecular representations, morgan fingerprint performs better in terms of accuracy and F-measure, however run time for parameter tuning and train is longer with fingerprint representations. As far as the machine learning algorithms are concerned, SVM classifier with morgan fingerprint performs better with higher accuracy and F-measure. With descriptor vector representation, we examine a set of molecular descriptors and using RF classifier, we evaluate most effective molecular descriptor for each ADMET property. For some datasets, we add the most contributive descriptor to morgan fingerprint representation and report an increase on evaluation metrics.
Benzer Tezler
- Development of a computer based monitoring system and ıts usage for power shovels monitoring
Bilgisayara dayalı bir izleme sisteminin geliştirilmesi ve elektrikli ekskavatörlerin izlenmesinde kullanımı
MEHMET ALİ HİNDİSTAN
Doktora
İngilizce
1997
Maden Mühendisliği ve MadencilikOrta Doğu Teknik ÜniversitesiMaden Mühendisliği Ana Bilim Dalı
PROF. DR. CELAL KARPUZ
- Survival modeling in cutaneous melanoma via integrative transcriptomic and epigenetic bioinformatics
Kutanöz melanomda transkriptomik ve epigenetik biyoinformatik entegrasyonu ile sağkalım modellemesi
SUMAILA ABUBAKARI
Doktora
İngilizce
2025
BiyoistatistikYıldız Teknik Üniversitesiİstatistik Ana Bilim Dalı
PROF. DR. FİLİZ KARAMAN
- Manisa bölgesinde 'ST segment yükselmesi olmayan miyokard infarktüsü' tanısı alan hastalarda kardiyovasküler risk faktörlerine göre koroner lezyonların dağılımının incelenmesi
Prediction of the significance of coronary arterial lesions by the assessment of the cardiovasular risk factors in patients with 'NON-ST elevated myocardial infarction' in Manisa region
EDA ÖZLEK
Tıpta Uzmanlık
Türkçe
2015
KardiyolojiCelal Bayar ÜniversitesiKardiyoloji Ana Bilim Dalı
PROF. DR. ALİ RIZA BİLGE
- Travmatik beyin hasarlı çocuklarda klinik, elektrofizyolojik ve görüntüleme yöntemleri ile prognoz belirlenmesi
Prediction of prognosis by clinical, electrophysiological and imaging techniques in children with traumatic brain injury
AHMET YILDIRIM
Tıpta Uzmanlık
Türkçe
2015
Çocuk Sağlığı ve HastalıklarıEge ÜniversitesiÇocuk Sağlığı ve Hastalıkları Ana Bilim Dalı
PROF. DR. GÜL SERDAROĞLU
- Prediction of the cutting forces for robotic grinding processes with abrasive mounted bits
Aşındırıcı taş kullanılan robotik taşlama proseslerinde kesme kuvvetlerinin tahmini
KEMAL AÇIKGÖZ
Yüksek Lisans
İngilizce
2015
Makine MühendisliğiOrta Doğu Teknik ÜniversitesiMakine Mühendisliği Ana Bilim Dalı
DOÇ. DR. ERHAN İLHAN KONUKSEVEN