Multi-view subcellular localization prediction of human proteins
İnsan proteinlerinin çoklu görünüm yoluyla hücre içi yerleşimlerinin tahmini
- Tez No: 574757
- Danışmanlar: PROF. DR. MEHMET VOLKAN ATALAY
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2019
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 118
Özet
Protinlerin hücre içi yerleşimlerinin belirlenmesi proteinlerin fonksiyonlarını anlamakta, ilaç belirleme çalışmalarında, sistem biyolojide ve protemik araştırmalarda büyük önem arz etmektedir. Proteinlerin hücre içi yerleşimlerini otomatik olarak tahmin eden bir çok hesaba dayalı metot vardır. Fakat hala daha iyi performans verebilecek çalışmalara ihtiyaç vardır. Biz çalışmamızda çoklu görünüme ve destek vektör makinalarına dayalı insan proteinlerinin hücre içi yerleşimlerini tahmin eden yeni bir yöntem ortaya koyuyoruz. Her bir proteini çoklu görünüm sağlayan birden fazla özellik ile ifade ediyoruz. Bu özellikler fiziko kimyasal özellikler, amino asit bileşimleri ve homoloji tabanlı özelliklerdir. Bizim sınıflandırma modelimiz her bir yerleşim için ihtimal belirten sonuç veren yedi sınıflandırma içerir. Çok görünümlü sistem geliştirme amacıyla sınıflandırıcıları ayırıcı gücüne dayalı olarak farklı ağırlıklar veren ağırlıklı sınıflandırma metodunu kullandık. Bu yöntemimizi data önce test amaçlı kullanılmış veriler üzerinde ve kendi geliştirdiğimiz yeni veri üzerinde değerlendirdik. Kendi oluşturduğumuz Trust (Güven) veri kümesini UniProtKB hücre içi hiyerarşisini ve GO (gen ontoloji) hücresel bileşenler hiyerarşisini birleştirerek oluşturduğumuz özgün hücre içi yerleşim hiyerarşisini otomatik olmayan şerhlere sahip proteinlere uygulayarak elde ettik. Sonuçlarımızı en gelişkin beş metot olan SubCons, LocTree2, CELLO2.5, MultiLoc2 ve DeepLoc yöntemleri ile karşılaştırdık.Bizim ortaya koyduğumuz yaklaşım test için kullandığımız üç veri kümesi olan Trust (biz oluşturduk), Golden(Subcons'un veri kümesi) ve Golden-Trust (iyileştirdiğimiz Golden veri kümesi) üzerinde sırasıyla 59%, 61%, 68% ortalama Matthews correlation coefficient (MCC) skorları elde ederken diğer beş metotta bize en yakın ortalama skorlara ulaşan Subcons 43%, 53%, and 56% MCC skorlarına ulaşmıştır.
Özet (Çeviri)
Determining the subcellular localization of proteins is crucial for understanding the functions of proteins, drug targeting, systems biology, and proteomics research. Experimental validation of subcellular localization is an expensive and challenging process. There exist several computational methods for automated prediction of protein subcellular localization; however, there is still room for better performance. Here, we propose a multi-view SVM-based approach that provides predictions for human proteins. We represent each protein sequence by multi-view features; i.e., physicochemical properties, amino acid compositions, and homology-based features. Our classification model contains seven classifiers for each localization, where each classifier provides a probabilistic result. To develop a multi-view voting classifier, we employ a weighted classifier combination method that assigns different weights to classifiers based on their discriminative strengths. We evaluated the described method on previously used datasets, as well as on our in-house dataset, called Trust dataset. Trust dataset is created by using a new subcellular localization hierarchy which merges UniProtKB Subcellular Location hierarchy and GO Cellular Component hierarchy by applying it on only manual experimental annotations in UniProtKB. We compared our results with five state-of-the-art methods, which are SubCons, LocTree2, CELLO2.5, MultiLoc2, and DeepLoc. Our approach outperformed the others with 59%, 61%, 68% overall Matthews correlation coefficient (MCC) scores on Trust, Golden (SubCons benchmark dataset), Golden-Trust (refined Golden dataset) datasets, respectively where SubCon's MCC scores were 43%, 53%, and 56%.
Benzer Tezler
- Multi-view feature extraction based on canonical correlation analysis
Kanonik korelasyon tabanlı çok-bakışlı oznitelik çıkarımı
CEMAL OKAN ŞAKAR
Doktora
İngilizce
2014
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. FİKRET GÜRGEN
DOÇ. DR. OLCAY KURŞUN
- Multi-view short-text classification using knowledge bases
Bilgi tabanı kullanarak çok görüntülü kısa metin sınıflandırma
MERT ÇALIŞAN
Yüksek Lisans
İngilizce
2016
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBahçeşehir ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. CEMAL OKAN ŞAKAR
- Generalized multi-view data proliferator (gem-vip) for boosting classification
Genelleştirilmiş çok boyutlu veri üretimi ile sınıflandırma hassaslığının yükseltilmesi
MUSTAFA ÇELİK
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ISLEM REKIK
- Multi-view feature matching with neural networks in the context of autonomous driving
Başlık çevirisi yok
DENİZ CAN ORUÇ
Yüksek Lisans
İngilizce
2023
Mühendislik BilimleriKatholieke Universiteit Leuven (Catholic University of Leuven)PROF. DR. M.-F. MOENS
PROF. DR. L. VAN GOOL
- QoE aware multi-view video transmission over P2P networks
Eşten eşe ağlar üzerinden görsel deneyim kalitesine duyarlı çoklu-görüntülü video iletimi
SAADET SEDEF SAVAŞ
Yüksek Lisans
İngilizce
2011
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKoç ÜniversitesiElektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. AHMET MURAT TEKALP