Prediction of druggability properties of chemicals using machine learning techniques
Makina öğrenmesi tekniklerini kullanarak kimyasalların ilaç olabilirliğinin tahmin edilmesi
- Tez No: 632498
- Danışmanlar: DOÇ. DR. ARZUCAN ÖZGÜR TÜRKMEN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2020
- Dil: İngilizce
- Üniversite: Boğaziçi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
- Sayfa Sayısı: 91
Özet
İlaç keşfi, yeni ilaç tasarlama ve geliştirme sürecidir ancak bu alanda yapılan araştırmalar maliyetlidir ve uzun zaman almaktadır. Piyasada ilaç benzeri bir çok molekül önerilmiş olmasına rağmen, onaylanan ve piyasaya sürülen ilaçların sayısı çok düşüktür, çünkü ilaç aday moleküllerinin çoğu düşük farmakokinetik özelliklere sahiptir. Bu nedenle, ilaç benzeri moleküllerin Emilim, Dağılım, Metabolizma, Boşaltım, Zehirlilik özelliklerinin erken değerlendirilmesi, maliyetli ve başarısız çalışmalardan kaçınılabilinmesi açısından ilaç endüstrisi için oldukça önemlidir. Amacımız, ilaç aday moleküllerinin ilaç olabilme özelliklerini öngören bir yaklaşım ortaya koymak ve ADMET özellikleri ile moleküler tanımlayıcılar arasındaki ilişkileri belirtmektir.\par Bu tez çalışmasında, k en yakın komşu, destek vektör makineleri ve rastgele orman olmak üzere 3 farklı makine öğrenme algoritması kullanarak, moleküllerin ilaç olabilme özelliklerini tahmin etmek için 4 farklı molekül temsilini, 9 ADMET özelliği veri kümesi üzerinde inceleyip karşılaştırıyoruz. Tüm moleküler gösterimler arasında, morgan parmak izinin doğruluk ve F-ölçümü açısından daha iyi performans gösterdiğine, ancak parametre ayarlama ve algoritma eğitim süresinin parmak izi gösterimleri ile daha uzun olduğu sonucuna vardık. Makine öğrenme algoritmaları söz konusu olduğunda, morgan parmak izi kullanılan DVMS, daha yüksek doğruluk ve F-ölçümü göstermektedir. Moleküler tanımlayıcılardan oluşan vektör temsili ile RF sınıflandırıcısını kullanarak her ADMET özelliği için en etkili moleküler tanımlayıcıyı değerlendiriyoruz. Bazı veri kümeleri için, morgan parmak izi temsiline en çok katkıda bulunan tanımlayıcıyı ekleyerek yaptığımız deneylerde değerlendirme metriklerinde artış gözlemekteyiz.
Özet (Çeviri)
Drug discovery is the process of designing and developing new medicine. The research and clinical experiments for new drug proposals are costly and take a long time. Although there has been proposed a lot of drug-like molecules, the number of drugs that are confirmed by regulating bodies and released to the market is very low. That is because most of the drug candidate molecules have low pharmacokinetic properties. Therefore, early assessments of ADMET properties have gained extreme importance for pharmaceutical industry, to be able to avoid costly failures. Here, our aim is to come up with an approach that reliably predicts druggability features of drug candidate molecules as well as to point out the relations between ADMET properties and molecular descriptors. \par In this thesis study, we examine and compare 4 different molecule representations to predict druggability features of molecules, using 3 different machine learning algorithms; namely k-nearest neighbor, support vector machine classifier and random forest on 9 ADMET property datasets. We conclude that among all molecular representations, morgan fingerprint performs better in terms of accuracy and F-measure, however run time for parameter tuning and train is longer with fingerprint representations. As far as the machine learning algorithms are concerned, SVM classifier with morgan fingerprint performs better with higher accuracy and F-measure. With descriptor vector representation, we examine a set of molecular descriptors and using RF classifier, we evaluate most effective molecular descriptor for each ADMET property. For some datasets, we add the most contributive descriptor to morgan fingerprint representation and report an increase on evaluation metrics.
Benzer Tezler
- Development of a computer based monitoring system and ıts usage for power shovels monitoring
Bilgisayara dayalı bir izleme sisteminin geliştirilmesi ve elektrikli ekskavatörlerin izlenmesinde kullanımı
MEHMET ALİ HİNDİSTAN
Doktora
İngilizce
1997
Maden Mühendisliği ve MadencilikOrta Doğu Teknik ÜniversitesiMaden Mühendisliği Ana Bilim Dalı
PROF. DR. CELAL KARPUZ
- Prediction of financial performance in İstanbul Stock Exchange: A comparative analysis
İstanbul Menkul Kıymetler Borsası finansal performans tahmini: Karşılaştırmalı analiz
ÖZGÜR TÜRETKEN
Yüksek Lisans
İngilizce
1999
İşletmeOrta Doğu Teknik Üniversitesiİşletme Ana Bilim Dalı
DR. SEZA DANIŞOĞLU RHOADES
- Prediction of learned despain in rats using artificial neural networks
Yapay sinir ağlarıyla sıçanlarda öğrenilmiş çaresizlik tahmini
İPEK ORUÇ
Yüksek Lisans
İngilizce
1999
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. A. C. CEM SAY
- Prediction of failure of commercial banks in Turkey
Türkiye'deki ticari bankaların iflas tahminleri
BÜLENT YAĞLI
Yüksek Lisans
İngilizce
1996
Bankacılıkİhsan Doğramacı Bilkent Üniversitesiİşletme Yönetimi Ana Bilim Dalı
DOÇ. DR. GÜLNUR MURADOĞLU
- Zihinsel ve işitme engelliler okullarında görev yapan yönetici ve öğretmenlerde tükenmişliğin kestirilmesi
Prediction of burnout levels of the teachers and administrators working in the special education schools for the hearing impaired and mentally retarded children
ÖMAY ÇOKLUK
Yüksek Lisans
Türkçe
1999
Eğitim ve ÖğretimAnkara ÜniversitesiÖzel Eğitim Ana Bilim Dalı
DOÇ. DR. BÜLBİN SUCUOĞLU
DOÇ. DR. NİLGÜN KÖKLÜ