Computer-based approaches in biosequence data analysis
Biyosekans veri analizinde bilgisayar-tabanlı yaklaşımlar
- Tez No: 652672
- Danışmanlar: PROF. DR. ÇAĞIN KANDEMİR ÇAVAŞ
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2020
- Dil: İngilizce
- Üniversite: Dokuz Eylül Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Bilimleri Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 50
Özet
Proteinlerin yapısı ve işlevi birbiriyle yakından ilgilidir. Sinyal proteinleri protein sekresyonu, taşınması gibi birçok biyolojik aktiviteye katılır. Sinyal proteinleri yeni ilaç bulunması alanında önemli bir konudur. Bu sebeplerden dolayı bir proteini sınıflandırıp sinyal proteini olup olmadığını bilmek önemlidir. Makine öğrenme çözümleri iyi bir seçenektir; çünkü deneysel çözümler pahalıdır ve zaman alırlar. Bu tezin amacı sinyal proteinlerini protein kodlama yöntemleri ve makine öğrenme algoritmaları kullanarak sınıflandırmaktır. 1867 sinyal ve 3317 sinyal olmayan protein indirildi. Sonra bu proteinler, psödo amino asit kompozisyonu (PseAAC) ve dipeptid kompozisyonu kullanılarak iki veri seti oluşturmak için dönüştürüldü. Derin yapay sinir ağı, rastgele orman ve destek vektör makinesi algoritmaları kullanılarak sinyal proteinleri sınıflandırıldı. İki veri setinde de algoritmaların doğruluk oranları 0,70'den yüksek çıkmıştır ve bu modellerin protein kodlama yöntemleriyle kodlanan sinyal proteinlerinin sınıflandırılmasında etkin olduğunu göstermektedir.
Özet (Çeviri)
The structure and function of proteins are closely related. Signaling proteins take part in many biological activities like protein secretion, transportation and more. Signaling proteins are an important topic in drug discovery. For these reasons it is important to classify whether a protein is signaling or not. Machine learning solutions are a good option for this because experimental solutions are time consuming and expensive. The aim of this thesis is to classify signaling proteins using protein encoding schemes and machine learning algorithms. 1867 signaling and 3317 non-signaling proteins were downloaded. Then they were transformed using pseudo amino acid composition (PseAAC) and dipeptide composition to create two datasets. Deep neural network, random forest and support vector machine algorithms were used to classify signaling proteins. For both datasets, the accuracy rate of all models were higher than 0.70. It shows that these models are effective in signal protein classification used with protein encoding schemes.
Benzer Tezler
- Temel tasarım eğitiminde bilgisayar oyunu tabanlı bir model
Computer game based model in basic design education
EMİRHAN COŞKUN
- Bilgisayar temelli bireyselleştirilmiş test yaklaşımlarının Türkiye'deki merkezi dil sınavlarında uygulanabilirliğinin araştırılması
Investigation of applicability of computer-based adaptive testing approaches to central language exams in Turkey
ERCAN ÇOBAN
Doktora
Türkçe
2020
Eğitim ve ÖğretimAnkara ÜniversitesiÖlçme ve Değerlendirme Ana Bilim Dalı
DOÇ. DR. CELAL DEHA DOĞAN
- Learning-based approaches in protein motif extraction
Protein motif çıkarımında öğrenme-tabanlı yaklaşımlar
ÇAĞLA ÇINAR
Yüksek Lisans
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolDokuz Eylül ÜniversitesiBilgisayar Bilimleri Ana Bilim Dalı
DOÇ. DR. ÇAĞIN KANDEMİR ÇAVAŞ
- Synthetic attributes for image classification
İmge sınıflandırma için sentetik nitelikler
MEHMET KARAYEL
Yüksek Lisans
İngilizce
2013
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolDeniz Harp Okulu KomutanlığıBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. NAFİZ ARICA