Optimizing classifiers for protein secondary structure prediction
Protein ikincil yapısının tahmini için sınıflandırma yöntemlerinin optimizasyonu
- Tez No: 476265
- Danışmanlar: YRD. DOÇ. DR. ZAFER AYDIN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2017
- Dil: İngilizce
- Üniversite: Abdullah Gül Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 76
Özet
Protein ikincil yapı tahmini, proteinin yapısını ve fonksiyonunu anlamak için önemli ve yaygın olarak kullanılan bir aşamadır. İkincil yapı tahmin bilgisi üç boyutlu yapı tahmini için de kullanıldığından protein dizisiyle üç boyutlu yapısı arasında bir köprü olarak görülebilir. Şimdiye kadar, tahmin doğruluk oranını artırmak için birçok yöntem geliştirilmiştir. Yöntemlerin performansını etkileyecek birden fazla durum vardır. Bunlar arasında model hiper-parametrelerinin doğru seçilmesi önem taşımaktadır. Model eğitme sürecinde direkt olarak öğrenilemeyen bu parametrelerin optimize edilmesiyle modellerin hassas olarak ayarlanması mümkündür. Bu sayede aşırı uyum ve eksik uyum gibi davranışlardan kaçınılması amaçlanır. Bu tezde, destek vektör makinesi, derin katlamalı yapay sinir alanları ve rastgele orman yöntemleri bir hibrit sınıflandırıcının ikinci aşamasında kullanılmak üzere optimize edilmiş ve ikincil yapı tahmini problemine uygulanmıştır. Buna ek olarak eğitilen sınıflandırıcılardan elde edilen tahminler bir topluluk yöntemi ile farklı kombinasyonlarda birleştirilmiş ve başarı oranları en zor tahmin koşulu için incelenmiştir. Geliştirilen yöntemlerin doğruluk oranları literatürdeki en iyi yöntemler ile aynı seviyededir ve farklı modellerin birleştirilmesinin tahmin başarısını iyileştirme potansiyeli bulunduğu gösterilmiştir.
Özet (Çeviri)
Protein secondary structure prediction (PSSP) is important for understanding protein structure and function. It can be seen as a bridge between amino acid sequence and three-dimensional (3-D) structure of a protein. To date, many methods have been proposed to improve prediction accuracy. There are multiple conditions that will affect the performance of a method. One of these is the selection of correct hyper parameters, which may not be learned directly from the regular training process. Optimizing these hyper-parameters enable us to fine-tune the model complexity preventing over-fitting and under-fitting. In this thesis, we optimized a support vector machine, a deep convolutional neural field and a random forest for the second stage of a hybrid classifier for protein secondary structure prediction. In addition, we built an ensemble classifier that combines the predictions from the individual methods in various combinations. We demonstrate that the overall accuracy of the ensemble is comparable to the success rates of the state-of-the-art methods in the most difficult prediction setting and combining the selected models have the potential to further improve the accuracy of the base learners.
Benzer Tezler
- Low-Complexity Supervised Learning for Gesture and Shape Recognition
Hareket ve Şekil Tanıma için Az Karmaşıklıklı Gözetimli Öğrenme
SAİT ÇELEBİ
Yüksek Lisans
İngilizce
2014
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Şehir ÜniversitesiElektronik ve Bilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. TARIK ARICI
- Kuantum Fisher Bilgisi Optimizasyonu Önerisi ve Dolanıklık Ölçütleri ile ilişkisi
A Proposal for Quantum Fisher Information Optimization and its Relation with Entanglement Measures
VOLKAN EROL
Doktora
Türkçe
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOkan ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. AZMİ ALİ ALTINTAŞ
DOÇ. DR. FATİH ÖZAYDIN
- A discrete-continuous optimization approach for the design and operation of synchromodal transportation networks
Synchromodal ulaşım ağları tasarımı ve işletilmesi için ayrık-sürekli optimizasyon yaklaşımı
HAMDİ GİRAY REŞAT
Doktora
İngilizce
2016
Endüstri ve Endüstri MühendisliğiKoç ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
PROF. DR. METİN TÜRKAY
- Belirsizlik altında insani yardım organizasyonlarının performanslarının ve lojistik ağ yapılarının iyileştirilmesi için çözüm yaklaşımları
Solution approaches for improving performances and logistics network structures of humanitarian relief organizations under uncertainty
ERKAN ÇELİK
Doktora
Türkçe
2015
Endüstri ve Endüstri MühendisliğiYıldız Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. ALEV TAŞKIN GÜMÜŞ
- Spatial-temporal agricultural information system to optimize pesticide usage by creating a buffer-zone
Koruma alanı oluşturularak ilaç kullanımı en iyileyeme konumsal-zamansal tarımsal bilgi sistemi
PETER AYEBARE
Yüksek Lisans
İngilizce
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolDokuz Eylül ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. CANAN EREN ATAY