Multi-view subcellular localization prediction of human proteins
İnsan proteinlerinin çoklu görünüm yoluyla hücre içi yerleşimlerinin tahmini
- Tez No: 574757
- Danışmanlar: PROF. DR. MEHMET VOLKAN ATALAY
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2019
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 118
Özet
Protinlerin hücre içi yerleşimlerinin belirlenmesi proteinlerin fonksiyonlarını anlamakta, ilaç belirleme çalışmalarında, sistem biyolojide ve protemik araştırmalarda büyük önem arz etmektedir. Proteinlerin hücre içi yerleşimlerini otomatik olarak tahmin eden bir çok hesaba dayalı metot vardır. Fakat hala daha iyi performans verebilecek çalışmalara ihtiyaç vardır. Biz çalışmamızda çoklu görünüme ve destek vektör makinalarına dayalı insan proteinlerinin hücre içi yerleşimlerini tahmin eden yeni bir yöntem ortaya koyuyoruz. Her bir proteini çoklu görünüm sağlayan birden fazla özellik ile ifade ediyoruz. Bu özellikler fiziko kimyasal özellikler, amino asit bileşimleri ve homoloji tabanlı özelliklerdir. Bizim sınıflandırma modelimiz her bir yerleşim için ihtimal belirten sonuç veren yedi sınıflandırma içerir. Çok görünümlü sistem geliştirme amacıyla sınıflandırıcıları ayırıcı gücüne dayalı olarak farklı ağırlıklar veren ağırlıklı sınıflandırma metodunu kullandık. Bu yöntemimizi data önce test amaçlı kullanılmış veriler üzerinde ve kendi geliştirdiğimiz yeni veri üzerinde değerlendirdik. Kendi oluşturduğumuz Trust (Güven) veri kümesini UniProtKB hücre içi hiyerarşisini ve GO (gen ontoloji) hücresel bileşenler hiyerarşisini birleştirerek oluşturduğumuz özgün hücre içi yerleşim hiyerarşisini otomatik olmayan şerhlere sahip proteinlere uygulayarak elde ettik. Sonuçlarımızı en gelişkin beş metot olan SubCons, LocTree2, CELLO2.5, MultiLoc2 ve DeepLoc yöntemleri ile karşılaştırdık.Bizim ortaya koyduğumuz yaklaşım test için kullandığımız üç veri kümesi olan Trust (biz oluşturduk), Golden(Subcons'un veri kümesi) ve Golden-Trust (iyileştirdiğimiz Golden veri kümesi) üzerinde sırasıyla 59%, 61%, 68% ortalama Matthews correlation coefficient (MCC) skorları elde ederken diğer beş metotta bize en yakın ortalama skorlara ulaşan Subcons 43%, 53%, and 56% MCC skorlarına ulaşmıştır.
Özet (Çeviri)
Determining the subcellular localization of proteins is crucial for understanding the functions of proteins, drug targeting, systems biology, and proteomics research. Experimental validation of subcellular localization is an expensive and challenging process. There exist several computational methods for automated prediction of protein subcellular localization; however, there is still room for better performance. Here, we propose a multi-view SVM-based approach that provides predictions for human proteins. We represent each protein sequence by multi-view features; i.e., physicochemical properties, amino acid compositions, and homology-based features. Our classification model contains seven classifiers for each localization, where each classifier provides a probabilistic result. To develop a multi-view voting classifier, we employ a weighted classifier combination method that assigns different weights to classifiers based on their discriminative strengths. We evaluated the described method on previously used datasets, as well as on our in-house dataset, called Trust dataset. Trust dataset is created by using a new subcellular localization hierarchy which merges UniProtKB Subcellular Location hierarchy and GO Cellular Component hierarchy by applying it on only manual experimental annotations in UniProtKB. We compared our results with five state-of-the-art methods, which are SubCons, LocTree2, CELLO2.5, MultiLoc2, and DeepLoc. Our approach outperformed the others with 59%, 61%, 68% overall Matthews correlation coefficient (MCC) scores on Trust, Golden (SubCons benchmark dataset), Golden-Trust (refined Golden dataset) datasets, respectively where SubCon's MCC scores were 43%, 53%, and 56%.
Benzer Tezler
- Multi-view video coding via dense depth field
Sık derinlik haritası ile çok-görüntülü video kodlaması
BURAK OĞUZ ÖZKALAYCI
Yüksek Lisans
İngilizce
2006
Elektrik ve Elektronik MühendisliğiOrta Doğu Teknik ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DOÇ.DR. AYDIN ALATAN
- Multi-view feature extraction based on canonical correlation analysis
Kanonik korelasyon tabanlı çok-bakışlı oznitelik çıkarımı
CEMAL OKAN ŞAKAR
Doktora
İngilizce
2014
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. FİKRET GÜRGEN
DOÇ. DR. OLCAY KURŞUN
- Adaptive P2P streaming with application to multi-view video
Çoklu görüntülü video uygulaması ile adaptif P2P akıtımı
CİHAT GÖKTUĞ GÜRLER
Doktora
İngilizce
2013
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKoç ÜniversitesiElektrik Mühendisliği Ana Bilim Dalı
PROF. DR. A. MURAT TEKALP
- Multi-view short-text classification using knowledge bases
Bilgi tabanı kullanarak çok görüntülü kısa metin sınıflandırma
MERT ÇALIŞAN
Yüksek Lisans
İngilizce
2016
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBahçeşehir ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. CEMAL OKAN ŞAKAR
- Multi-view structure from motion software platform for augmented reality applications
Eklenmiş gerçeklik uygulamaları için çok görüşlü hareketten yapı çıkarımı yazılım platformu
CENGİZ HÜROĞLU
Yüksek Lisans
İngilizce
2014
Elektrik ve Elektronik MühendisliğiÖzyeğin ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. ARİF TANJU ERDEM