Sürekli/ikili parçacık sürü optimizasyonu ve destek vektör makinelerinin hibrit kullanımı ile özellik seçimi
Feature selection with hybrid using of continious/binary particle swarm optimization and support vector machine
- Tez No: 565504
- Danışmanlar: DOÇ. DR. AYÇA ÇAKMAK PEHLİVANLI
- Tez Türü: Yüksek Lisans
- Konular: İstatistik, Statistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2019
- Dil: Türkçe
- Üniversite: Mimar Sinan Güzel Sanatlar Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: İstatistik Ana Bilim Dalı
- Bilim Dalı: İstatistik Bilim Dalı
- Sayfa Sayısı: 68
Özet
İlaç geliştirme süreci maliyetli, karmaşık ve zaman alan bir süreçtir. Bu süreçte, en uzun süreli aşamalardan biri olan, on binlerce molekül arasından olası ilaç aday moleküllerinin seçilmesi aşamasında, hesaplamalı yöntemlerin ve yaklaşımların kullanılması maliyeti düşürmeyi, karmaşıklığı azaltmayı ve ilaç gelişimini çok daha kısa sürede yapmayı mümkün kılmıştır. Bu hesaplamalı yöntemler arasında özellikle son on yıldır istatistiksel temelli makine öğrenmesi yaklaşımları ve ilaç olma özelliğini en iyi şekilde belirleyen özelliklerin bulunmasına yönelik özellik seçim algoritmaları en fazla tercih edilenlerdir. İlaç veri setlerindeki ilgisiz özelliklerin varlığı, sınıflandırma başarısını olumsuz etkilemekte ve dolayısıyla ilaç olabilecek moleküllerin gözden kaçmasına sebep olmaktadır. Bu problemi çözmek adına tek başına özellik seçimi ya da tek başına sınıflandırma algoritmaları kullanmak yerine, bu iki yaklaşımı etkin olarak hibritlemek özellikle son yıllarda gelişen teknolojik gelişmeler ile daha da etkili olmuştur. Bu çalışma kapsamında, aday ilaç moleküllerini belirlemekte etkin özelliklerin seçimi için tıp, finans, mühendislik gibi birçok alanda başarılı sonuçlar veren sezgisel algoritmalardan sürekli/ikili parçacık sürü optimizasyonu ile destek vektör makineleri hibritlenmiştir. Çalışmada kullanılan Cherkasov ve Murcia-Soler veri setleri birbirinden tamamen farklı olup, ilaç ve ilaç olmayan moleküllerden oluşan ve Molecular Operating Environment programı ile hesaplanan 161 açıklayıcı özellik içermektedir. Murcia-Soler veri seti hibrit yaklaşımda ikili sürekli parçacık sürü optimizasyonu ile özellikleri belirlemek için kullanılmış ve hibrit yaklaşımın seçtiği özelliklerin sınıflandırma başarısını ölçmek için Cherkasov verisi kullanılmıştır. Elde edilen sonuçlar özellik sayısı ve sınıflandırma başarısı açısından sürekli parçacık sürü optimizasyonu ve destek vektör makineleriyle elde edilen sonuçlarla karşılaştırılmıştır. Seçilen 49 özellik ve %92,54 sınıflandırma başarısıyla %1-2'lik iyileşme elde edilmiştir. Bu çalışmada elde edilen sonuçlar doğrultusunda, ilaç geliştirme sürecinin erken evrelerinde, etkin özellik seçimi yöntemi sonucunda daha az sayıda özellik ile sınıflandırma başarısında iyileşme elde edilebilmektedir. Bunun sonucunda potansiyel ilaç aday moleküllerin seçilmesiyle, laboratuvar ortamında incelenecek aday molekül sayısı minimize edilmekte ve böylece ilaç geliştirme süresinin, maliyetinin ve, hayvan deney sayısının azaltılabileceği düşünülmektedir.
Özet (Çeviri)
Development process of drugs could be costly, complex and highly time consuming. Thanks to help of computational methods and approaches, finding the possible usefull molecules for drug development within thousands of molecules, which is one of the most time consuming phase, could become less complex and less time-consuming. Within these computational methods, statistical based machine learning approach and variable selective algorithms ,that helps us to distinguish most possible drug-like variables, are the most preferred methods. Having the irrelavant characteristics within these data sets can directly affect the possiblity of finding the beneficial molecules for drug development hence it has direct effect on our success ratio. In order to avoid these possible problems, instead of using only variable selection or classification algorithms, in recent years it is understood that hybridization of these two methods could be more effective in coorditaion with the new technological developments. Within the scope of this study, two heuristic algorithm, dual particle swarm optimization and support vector machines, which are also successfully used in various industries such as medical, finance, engineering etc., are hybridized in order to select active characteristics of detecting beneficial drug molecules. The data sets, that are used in this study, Cherkasov and Murcia-Soler are different. These data sets include 161 explanatory variables that are calculated via Molecular Operating Environment programme. 161 data sets include both drug and non-drug related molecules. With Murcia-Soler data set hybridized approach, dual particle swarm optimization was used in order to identify related characteristic, and the success rate of the selection was tested by Cherkasov data. Final results of dual particle swarm optimization and support vector machines was compared according to their number of characteristic and succes rate of classification. With the number of 49 characteristis and the succes rate of 92,54, it seen that results were improved by 1-2%. In the lights of this result of the study, in the early stages of drug development process, with active characteristic selection method sucess rate can be improved by less characteristics. As a result of that, with the selection of right possible drug molecules, studies that are done in the laboratory could be less time consuming and less expensive thus requies less live animal experiments.
Benzer Tezler
- Özellik seçimi için güncel meta sezgisel optimizasyonları kullanılarak yeni ikili optimizasyon algoritması geliştirilmesi
Development of new binary optimization algorithm using current meta heuristic optimizations for feature selection
ABDULLAH ÇELİK
Yüksek Lisans
Türkçe
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat ÜniversitesiYazılım Mühendisliği Ana Bilim Dalı
PROF. DR. ERKAN TANYILDIZI
- Evrimsel hesaplama algoritmaları ile yapay sinir ağının bağlantı optimizasyonu
Connectivity optimization of artificial neural network with evolutionary computation algorithms
MERVE YILMAZ
Yüksek Lisans
Türkçe
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKonya Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. MUSTAFA SERVET KIRAN
- Optimizasyon problemlerinin çözümü için yapay arı kolonisi algoritması tabanlı yeni yaklaşımlar
Novel approaches based on articial bee colony algorithm to solve optimization pronlems
MUSTAFA SERVET KIRAN
Doktora
Türkçe
2014
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSelçuk ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. MESUT GÜNDÜZ
- Karışım problemlerinde esnek hesaplama yöntemleri kullanarak maliyet optimizasyonu
Cost optimization in mixture problems by using soft computing techniques
MEHMET AKİF ŞAHMAN
Doktora
Türkçe
2016
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSelçuk ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. ADEM ALPASLAN ALTUN
- Çok amaçlı nsga-ıı ve mopso optimizasyon algoritmaları ilekablosuz algılayıcı ağlarında optimum küme başı yeri seçimive kümelemesi
Selecting the optimum location of the cluster head in the wireless sensor networks and clustering via nsga-ii and mopso algorithms
VAHİD FARYAD AGHJEH KAND
Yüksek Lisans
Türkçe
2014
Elektrik ve Elektronik MühendisliğiKaradeniz Teknik ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. GÖKCE HACIOĞLU