Geri Dön

Protein fragment selection using machine learning

Makine öğrenmesi ile protein parçacık seçimi

  1. Tez No: 513554
  2. Yazar: ALPEREN EMRE ULUTAŞ
  3. Danışmanlar: DR. ZAFER AYDIN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Biyomühendislik, Computer Engineering and Computer Science and Control, Bioengineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2018
  8. Dil: İngilizce
  9. Üniversite: Abdullah Gül Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 85

Özet

Protein parçacık seçimi proteinlerin üç boyutlu yapılarının tahmin edilmesindeki önemli adımlardan biridir. Doğru parçacık yapılarının seçilmesi üç boyutlu yapının doğru tahmin edilmesi için gereklidir. Bu tezde verilen iki protein parçacığının üç boyutlu yapılarının birbirine benzer olup olmadığını tahmin eden çeşitli yapay öğrenme yöntemleri geliştirilmiştir. Bu sayede yapısı bilinmeyen bir hedef protein için parçacık yapılarının seçilmesi mümkün olacaktır. Tahmin yönteminin girdi olarak kullanacağı öznitelik parametrelerinin tasarlanması için bir konsept hiyerarşi yaklaşımı izlenmiştir. Bunun için dizi profil matrisleri, ikincil yapı, çözücü erişilirlik ve bükülme açı sınıfı tahminleri çeşitli kombinasyonlarda ve izdüşüm uzaylarında incelenmiştir. Üç ve dokuz amino asitlik parçacıkların yapısal benzerlik tahmini için çeşitli sınıflandırma ve regresyon modelleri eğitilmiş ve optimize edilmiştir. Bunlar arasında lojistik regresyon, AdaBoost, karar ağacı, en yakın komşu, sade Bayes, rastgele orman, destek vektör makinası ve çok-katmanlı algılayıcı bulunmaktadır. Elde edilen sonuçlara göre farklı öznitelik kümelerinin konsept hiyerarşi yaklaşımı ile birleştirilmesi ve model optimizasyonları tahmin başarısını önemli oranda iyileştirmiştir. Ayrıca çapraz doğrulama deneyleri neticesinde parçacık benzerliğinin yüksek başarı oranları ile tahmin edilebildiği gösterilmiştir. Parçacık benzerliği sınıflandırma problemi olarak tanımlandığı zaman tahmin yöntemlerinin başarı oranları birbirine yakın olarak elde edilmiştir. Regresyon modelleri arasında ise rastgele orman yöntemi en yüksek tahmin başarısına ulaşmıştır.

Özet (Çeviri)

Protein fragment selection is an important step in predicting the three-dimensional (3D) structure of proteins. Selecting the right fragments contributes significantly to accurate prediction of 3D structure. In this thesis, a machine learning approach is employed to predict whether a pair of protein fragments have similar 3D structures or not, which can be used to select fragment structures for a target protein with unknown structure. To design input features, a concepy hierarchy is implemented, which considers sequence profile matrices, predicted secondary structure, solvent accessibility and torsion angle classes as features in various combinations and projections. Several machine learning classifiers and regressors are trained and optimized for predicting the structural similarity of 3-mer and 9-mer fragments including logistic regression, AdaBoost, decision tree, k-nearest neighbor, naive Bayes, random forest, SVM and multi-layer perceptron. The results demonstrate that combining different feature sets through concept hierarcy and model optimization improves the prediction accuracy substantially. Furthermore it is possible to predict the structural similarity of fragment pairs with high accuracy, which is assessed by perforing cross-validation experiments on fragment datasets. When the structural similarity of fragments is defined as a classification problem, the accuracy of different classifiers are obtained as similar to each other. Among the regression methods, random forest provided the best accuracy metrics.

Benzer Tezler

  1. İnsektisitlere dirençli Myzus persicae (sulzer) (Hemiptera:Aphididae) popülasyonlarında asetilkolinesteraz geni ve sodyum kanalı geninde meydana gelen mutasyonların incelenmesi

    Investigation of mutations in acetylcholinesterase and sodium channel genes of resistant populations of Myzus persicae (sulzer) (Hemiptera:Aphididae)

    SELCAN ALPTEKİN

    Yüksek Lisans

    Türkçe

    Türkçe

    2009

    BiyoteknolojiAnkara Üniversitesi

    Ziraat Bölümü

    PROF. DR. M. OKTAY GÜRKAN

  2. Abaza ve Gürcü keçilerinde kappa-kazein proteininin polimorfizmi

    Kappa-casein polymorphism in abaza and gürcü goats

    HOUMAN ALLAHVERDIKHAN VAZIRI

    Yüksek Lisans

    Türkçe

    Türkçe

    2012

    GenetikAnkara Üniversitesi

    Genetik Ana Bilim Dalı

    PROF. DR. OKAN ERTUĞRUL

  3. Development and structural determination of antiangiogenic recombinant antibody structures for cancer treatment

    Kanser tedavisine yönelik antianjiogenik rekombinant antikor yapılarının geliştirilmesi ve yapısal tayini

    MELİS DENİZCİ ÖNCÜ

    Doktora

    İngilizce

    İngilizce

    2022

    Biyomühendislikİstanbul Teknik Üniversitesi

    Moleküler Biyoloji-Genetik ve Biyoteknoloji Ana Bilim Dalı

    PROF. DR. GİZEM DİNLER DOĞANAY

    DR. AYLİN ÖZDEMİR BAHADIR

  4. İnsan rinovirüslerinden HRV-14 suşunda CIM212240 (C25H32N6O) bileşiğinin antiviral etkisinin HeLa RH hücreleri kullanılarak incelenmesi

    Investigation of the antiviral effect using HeLa RH cells of CIM212240 (C25H32N6O) compound in strain HRV-14 of human rhinoviruses

    AYTUĞ MERİÇ

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    BiyolojiGazi Üniversitesi

    Biyoloji Ana Bilim Dalı

    PROF. DR. ZEHRANUR YÜKSEKDAĞ

  5. Hepatit C virüs zarf glikoproteininin saflaştırılarak elde edilmesi

    Obtaining of purified hepatitis C virus envelope glycoprotein

    ÖZGE ÖZTUNA

    Yüksek Lisans

    Türkçe

    Türkçe

    2012

    MikrobiyolojiDokuz Eylül Üniversitesi

    Mikrobiyoloji ve Klinik Mikrobiyoloji Ana Bilim Dalı

    DOÇ. DR. İ. M. ALİ ÖKTEM