Geri Dön

Sürekli/ikili parçacık sürü optimizasyonu ve destek vektör makinelerinin hibrit kullanımı ile özellik seçimi

Feature selection with hybrid using of continious/binary particle swarm optimization and support vector machine

  1. Tez No: 565504
  2. Yazar: NİLAY SUBAŞ
  3. Danışmanlar: DOÇ. DR. AYÇA ÇAKMAK PEHLİVANLI
  4. Tez Türü: Yüksek Lisans
  5. Konular: İstatistik, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2019
  8. Dil: Türkçe
  9. Üniversite: Mimar Sinan Güzel Sanatlar Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: İstatistik Bilim Dalı
  13. Sayfa Sayısı: 68

Özet

İlaç geliştirme süreci maliyetli, karmaşık ve zaman alan bir süreçtir. Bu süreçte, en uzun süreli aşamalardan biri olan, on binlerce molekül arasından olası ilaç aday moleküllerinin seçilmesi aşamasında, hesaplamalı yöntemlerin ve yaklaşımların kullanılması maliyeti düşürmeyi, karmaşıklığı azaltmayı ve ilaç gelişimini çok daha kısa sürede yapmayı mümkün kılmıştır. Bu hesaplamalı yöntemler arasında özellikle son on yıldır istatistiksel temelli makine öğrenmesi yaklaşımları ve ilaç olma özelliğini en iyi şekilde belirleyen özelliklerin bulunmasına yönelik özellik seçim algoritmaları en fazla tercih edilenlerdir. İlaç veri setlerindeki ilgisiz özelliklerin varlığı, sınıflandırma başarısını olumsuz etkilemekte ve dolayısıyla ilaç olabilecek moleküllerin gözden kaçmasına sebep olmaktadır. Bu problemi çözmek adına tek başına özellik seçimi ya da tek başına sınıflandırma algoritmaları kullanmak yerine, bu iki yaklaşımı etkin olarak hibritlemek özellikle son yıllarda gelişen teknolojik gelişmeler ile daha da etkili olmuştur. Bu çalışma kapsamında, aday ilaç moleküllerini belirlemekte etkin özelliklerin seçimi için tıp, finans, mühendislik gibi birçok alanda başarılı sonuçlar veren sezgisel algoritmalardan sürekli/ikili parçacık sürü optimizasyonu ile destek vektör makineleri hibritlenmiştir. Çalışmada kullanılan Cherkasov ve Murcia-Soler veri setleri birbirinden tamamen farklı olup, ilaç ve ilaç olmayan moleküllerden oluşan ve Molecular Operating Environment programı ile hesaplanan 161 açıklayıcı özellik içermektedir. Murcia-Soler veri seti hibrit yaklaşımda ikili sürekli parçacık sürü optimizasyonu ile özellikleri belirlemek için kullanılmış ve hibrit yaklaşımın seçtiği özelliklerin sınıflandırma başarısını ölçmek için Cherkasov verisi kullanılmıştır. Elde edilen sonuçlar özellik sayısı ve sınıflandırma başarısı açısından sürekli parçacık sürü optimizasyonu ve destek vektör makineleriyle elde edilen sonuçlarla karşılaştırılmıştır. Seçilen 49 özellik ve %92,54 sınıflandırma başarısıyla %1-2'lik iyileşme elde edilmiştir. Bu çalışmada elde edilen sonuçlar doğrultusunda, ilaç geliştirme sürecinin erken evrelerinde, etkin özellik seçimi yöntemi sonucunda daha az sayıda özellik ile sınıflandırma başarısında iyileşme elde edilebilmektedir. Bunun sonucunda potansiyel ilaç aday moleküllerin seçilmesiyle, laboratuvar ortamında incelenecek aday molekül sayısı minimize edilmekte ve böylece ilaç geliştirme süresinin, maliyetinin ve, hayvan deney sayısının azaltılabileceği düşünülmektedir.

Özet (Çeviri)

Development process of drugs could be costly, complex and highly time consuming. Thanks to help of computational methods and approaches, finding the possible usefull molecules for drug development within thousands of molecules, which is one of the most time consuming phase, could become less complex and less time-consuming. Within these computational methods, statistical based machine learning approach and variable selective algorithms ,that helps us to distinguish most possible drug-like variables, are the most preferred methods. Having the irrelavant characteristics within these data sets can directly affect the possiblity of finding the beneficial molecules for drug development hence it has direct effect on our success ratio. In order to avoid these possible problems, instead of using only variable selection or classification algorithms, in recent years it is understood that hybridization of these two methods could be more effective in coorditaion with the new technological developments. Within the scope of this study, two heuristic algorithm, dual particle swarm optimization and support vector machines, which are also successfully used in various industries such as medical, finance, engineering etc., are hybridized in order to select active characteristics of detecting beneficial drug molecules. The data sets, that are used in this study, Cherkasov and Murcia-Soler are different. These data sets include 161 explanatory variables that are calculated via Molecular Operating Environment programme. 161 data sets include both drug and non-drug related molecules. With Murcia-Soler data set hybridized approach, dual particle swarm optimization was used in order to identify related characteristic, and the success rate of the selection was tested by Cherkasov data. Final results of dual particle swarm optimization and support vector machines was compared according to their number of characteristic and succes rate of classification. With the number of 49 characteristis and the succes rate of 92,54, it seen that results were improved by 1-2%. In the lights of this result of the study, in the early stages of drug development process, with active characteristic selection method sucess rate can be improved by less characteristics. As a result of that, with the selection of right possible drug molecules, studies that are done in the laboratory could be less time consuming and less expensive thus requies less live animal experiments.

Benzer Tezler

  1. Özellik seçimi için güncel meta sezgisel optimizasyonları kullanılarak yeni ikili optimizasyon algoritması geliştirilmesi

    Development of new binary optimization algorithm using current meta heuristic optimizations for feature selection

    ABDULLAH ÇELİK

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat Üniversitesi

    Yazılım Mühendisliği Ana Bilim Dalı

    PROF. DR. ERKAN TANYILDIZI

  2. Evrimsel hesaplama algoritmaları ile yapay sinir ağının bağlantı optimizasyonu

    Connectivity optimization of artificial neural network with evolutionary computation algorithms

    MERVE YILMAZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKonya Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. MUSTAFA SERVET KIRAN

  3. Optimizasyon problemlerinin çözümü için yapay arı kolonisi algoritması tabanlı yeni yaklaşımlar

    Novel approaches based on articial bee colony algorithm to solve optimization pronlems

    MUSTAFA SERVET KIRAN

    Doktora

    Türkçe

    Türkçe

    2014

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSelçuk Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. MESUT GÜNDÜZ

  4. Karışım problemlerinde esnek hesaplama yöntemleri kullanarak maliyet optimizasyonu

    Cost optimization in mixture problems by using soft computing techniques

    MEHMET AKİF ŞAHMAN

    Doktora

    Türkçe

    Türkçe

    2016

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSelçuk Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ADEM ALPASLAN ALTUN

  5. Çok amaçlı nsga-ıı ve mopso optimizasyon algoritmaları ilekablosuz algılayıcı ağlarında optimum küme başı yeri seçimive kümelemesi

    Selecting the optimum location of the cluster head in the wireless sensor networks and clustering via nsga-ii and mopso algorithms

    VAHİD FARYAD AGHJEH KAND

    Yüksek Lisans

    Türkçe

    Türkçe

    2014

    Elektrik ve Elektronik MühendisliğiKaradeniz Teknik Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. GÖKCE HACIOĞLU