Protein fragment selection using machine learning
Makine öğrenmesi ile protein parçacık seçimi
- Tez No: 513554
- Danışmanlar: DR. ZAFER AYDIN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Biyomühendislik, Computer Engineering and Computer Science and Control, Bioengineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2018
- Dil: İngilizce
- Üniversite: Abdullah Gül Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 85
Özet
Protein parçacık seçimi proteinlerin üç boyutlu yapılarının tahmin edilmesindeki önemli adımlardan biridir. Doğru parçacık yapılarının seçilmesi üç boyutlu yapının doğru tahmin edilmesi için gereklidir. Bu tezde verilen iki protein parçacığının üç boyutlu yapılarının birbirine benzer olup olmadığını tahmin eden çeşitli yapay öğrenme yöntemleri geliştirilmiştir. Bu sayede yapısı bilinmeyen bir hedef protein için parçacık yapılarının seçilmesi mümkün olacaktır. Tahmin yönteminin girdi olarak kullanacağı öznitelik parametrelerinin tasarlanması için bir konsept hiyerarşi yaklaşımı izlenmiştir. Bunun için dizi profil matrisleri, ikincil yapı, çözücü erişilirlik ve bükülme açı sınıfı tahminleri çeşitli kombinasyonlarda ve izdüşüm uzaylarında incelenmiştir. Üç ve dokuz amino asitlik parçacıkların yapısal benzerlik tahmini için çeşitli sınıflandırma ve regresyon modelleri eğitilmiş ve optimize edilmiştir. Bunlar arasında lojistik regresyon, AdaBoost, karar ağacı, en yakın komşu, sade Bayes, rastgele orman, destek vektör makinası ve çok-katmanlı algılayıcı bulunmaktadır. Elde edilen sonuçlara göre farklı öznitelik kümelerinin konsept hiyerarşi yaklaşımı ile birleştirilmesi ve model optimizasyonları tahmin başarısını önemli oranda iyileştirmiştir. Ayrıca çapraz doğrulama deneyleri neticesinde parçacık benzerliğinin yüksek başarı oranları ile tahmin edilebildiği gösterilmiştir. Parçacık benzerliği sınıflandırma problemi olarak tanımlandığı zaman tahmin yöntemlerinin başarı oranları birbirine yakın olarak elde edilmiştir. Regresyon modelleri arasında ise rastgele orman yöntemi en yüksek tahmin başarısına ulaşmıştır.
Özet (Çeviri)
Protein fragment selection is an important step in predicting the three-dimensional (3D) structure of proteins. Selecting the right fragments contributes significantly to accurate prediction of 3D structure. In this thesis, a machine learning approach is employed to predict whether a pair of protein fragments have similar 3D structures or not, which can be used to select fragment structures for a target protein with unknown structure. To design input features, a concepy hierarchy is implemented, which considers sequence profile matrices, predicted secondary structure, solvent accessibility and torsion angle classes as features in various combinations and projections. Several machine learning classifiers and regressors are trained and optimized for predicting the structural similarity of 3-mer and 9-mer fragments including logistic regression, AdaBoost, decision tree, k-nearest neighbor, naive Bayes, random forest, SVM and multi-layer perceptron. The results demonstrate that combining different feature sets through concept hierarcy and model optimization improves the prediction accuracy substantially. Furthermore it is possible to predict the structural similarity of fragment pairs with high accuracy, which is assessed by perforing cross-validation experiments on fragment datasets. When the structural similarity of fragments is defined as a classification problem, the accuracy of different classifiers are obtained as similar to each other. Among the regression methods, random forest provided the best accuracy metrics.
Benzer Tezler
- İnsektisitlere dirençli Myzus persicae (sulzer) (Hemiptera:Aphididae) popülasyonlarında asetilkolinesteraz geni ve sodyum kanalı geninde meydana gelen mutasyonların incelenmesi
Investigation of mutations in acetylcholinesterase and sodium channel genes of resistant populations of Myzus persicae (sulzer) (Hemiptera:Aphididae)
SELCAN ALPTEKİN
- Abaza ve Gürcü keçilerinde kappa-kazein proteininin polimorfizmi
Kappa-casein polymorphism in abaza and gürcü goats
HOUMAN ALLAHVERDIKHAN VAZIRI
- Development and structural determination of antiangiogenic recombinant antibody structures for cancer treatment
Kanser tedavisine yönelik antianjiogenik rekombinant antikor yapılarının geliştirilmesi ve yapısal tayini
MELİS DENİZCİ ÖNCÜ
Doktora
İngilizce
2022
Biyomühendislikİstanbul Teknik ÜniversitesiMoleküler Biyoloji-Genetik ve Biyoteknoloji Ana Bilim Dalı
PROF. DR. GİZEM DİNLER DOĞANAY
DR. AYLİN ÖZDEMİR BAHADIR
- İnsan rinovirüslerinden HRV-14 suşunda CIM212240 (C25H32N6O) bileşiğinin antiviral etkisinin HeLa RH hücreleri kullanılarak incelenmesi
Investigation of the antiviral effect using HeLa RH cells of CIM212240 (C25H32N6O) compound in strain HRV-14 of human rhinoviruses
AYTUĞ MERİÇ
- Hepatit C virüs zarf glikoproteininin saflaştırılarak elde edilmesi
Obtaining of purified hepatitis C virus envelope glycoprotein
ÖZGE ÖZTUNA
Yüksek Lisans
Türkçe
2012
MikrobiyolojiDokuz Eylül ÜniversitesiMikrobiyoloji ve Klinik Mikrobiyoloji Ana Bilim Dalı
DOÇ. DR. İ. M. ALİ ÖKTEM