Multi-view subcellular localization prediction of human proteins

İnsan proteinlerinin çoklu görünüm yoluyla hücre içi yerleşimlerinin tahmini

PDF İndir

Tez No: 574757
Yazar: GÖKHAN ÖZSARI
Danışmanlar: PROF. DR. MEHMET VOLKAN ATALAY
Tez Türü: Yüksek Lisans
Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
Anahtar Kelimeler: Belirtilmemiş.
Yıl: 2019
Dil: İngilizce
Üniversite: Orta Doğu Teknik Üniversitesi
Enstitü: Fen Bilimleri Enstitüsü
Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
Bilim Dalı: Belirtilmemiş.
Sayfa Sayısı: 118

Özet

Protinlerin hücre içi yerleşimlerinin belirlenmesi proteinlerin fonksiyonlarını anlamakta, ilaç belirleme çalışmalarında, sistem biyolojide ve protemik araştırmalarda büyük önem arz etmektedir. Proteinlerin hücre içi yerleşimlerini otomatik olarak tahmin eden bir çok hesaba dayalı metot vardır. Fakat hala daha iyi performans verebilecek çalışmalara ihtiyaç vardır. Biz çalışmamızda çoklu görünüme ve destek vektör makinalarına dayalı insan proteinlerinin hücre içi yerleşimlerini tahmin eden yeni bir yöntem ortaya koyuyoruz. Her bir proteini çoklu görünüm sağlayan birden fazla özellik ile ifade ediyoruz. Bu özellikler fiziko kimyasal özellikler, amino asit bileşimleri ve homoloji tabanlı özelliklerdir. Bizim sınıflandırma modelimiz her bir yerleşim için ihtimal belirten sonuç veren yedi sınıflandırma içerir. Çok görünümlü sistem geliştirme amacıyla sınıflandırıcıları ayırıcı gücüne dayalı olarak farklı ağırlıklar veren ağırlıklı sınıflandırma metodunu kullandık. Bu yöntemimizi data önce test amaçlı kullanılmış veriler üzerinde ve kendi geliştirdiğimiz yeni veri üzerinde değerlendirdik. Kendi oluşturduğumuz Trust (Güven) veri kümesini UniProtKB hücre içi hiyerarşisini ve GO (gen ontoloji) hücresel bileşenler hiyerarşisini birleştirerek oluşturduğumuz özgün hücre içi yerleşim hiyerarşisini otomatik olmayan şerhlere sahip proteinlere uygulayarak elde ettik. Sonuçlarımızı en gelişkin beş metot olan SubCons, LocTree2, CELLO2.5, MultiLoc2 ve DeepLoc yöntemleri ile karşılaştırdık.Bizim ortaya koyduğumuz yaklaşım test için kullandığımız üç veri kümesi olan Trust (biz oluşturduk), Golden(Subcons'un veri kümesi) ve Golden-Trust (iyileştirdiğimiz Golden veri kümesi) üzerinde sırasıyla 59%, 61%, 68% ortalama Matthews correlation coefficient (MCC) skorları elde ederken diğer beş metotta bize en yakın ortalama skorlara ulaşan Subcons 43%, 53%, and 56% MCC skorlarına ulaşmıştır.

Özet (Çeviri)

Determining the subcellular localization of proteins is crucial for understanding the functions of proteins, drug targeting, systems biology, and proteomics research. Experimental validation of subcellular localization is an expensive and challenging process. There exist several computational methods for automated prediction of protein subcellular localization; however, there is still room for better performance. Here, we propose a multi-view SVM-based approach that provides predictions for human proteins. We represent each protein sequence by multi-view features; i.e., physicochemical properties, amino acid compositions, and homology-based features. Our classification model contains seven classifiers for each localization, where each classifier provides a probabilistic result. To develop a multi-view voting classifier, we employ a weighted classifier combination method that assigns different weights to classifiers based on their discriminative strengths. We evaluated the described method on previously used datasets, as well as on our in-house dataset, called Trust dataset. Trust dataset is created by using a new subcellular localization hierarchy which merges UniProtKB Subcellular Location hierarchy and GO Cellular Component hierarchy by applying it on only manual experimental annotations in UniProtKB. We compared our results with five state-of-the-art methods, which are SubCons, LocTree2, CELLO2.5, MultiLoc2, and DeepLoc. Our approach outperformed the others with 59%, 61%, 68% overall Matthews correlation coefficient (MCC) scores on Trust, Golden (SubCons benchmark dataset), Golden-Trust (refined Golden dataset) datasets, respectively where SubCon's MCC scores were 43%, 53%, and 56%.

Benzer Tezler

Tez No
180834
Multi-view video coding via dense depth field
Sık derinlik haritası ile çok-görüntülü video kodlaması
BURAK OĞUZ ÖZKALAYCI
Yüksek Lisans
İngilizce
2006
Elektrik ve Elektronik Mühendisliği Orta Doğu Teknik Üniversitesi
Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
DOÇ.DR. AYDIN ALATAN
Tez No
355747
Multi-view feature extraction based on canonical correlation analysis
Kanonik korelasyon tabanlı çok-bakışlı oznitelik çıkarımı
CEMAL OKAN ŞAKAR
Doktora
İngilizce
2014
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Boğaziçi Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. FİKRET GÜRGEN
DOÇ. DR. OLCAY KURŞUN
Tez No
333162
Adaptive P2P streaming with application to multi-view video
Çoklu görüntülü video uygulaması ile adaptif P2P akıtımı
CİHAT GÖKTUĞ GÜRLER
Doktora
İngilizce
2013
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Koç Üniversitesi
Elektrik Mühendisliği Ana Bilim Dalı
PROF. DR. A. MURAT TEKALP
Tez No
436049
Multi-view short-text classification using knowledge bases
Bilgi tabanı kullanarak çok görüntülü kısa metin sınıflandırma
MERT ÇALIŞAN
Yüksek Lisans
İngilizce
2016
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Bahçeşehir Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. CEMAL OKAN ŞAKAR
Tez No
371117
Multi-view structure from motion software platform for augmented reality applications
Eklenmiş gerçeklik uygulamaları için çok görüşlü hareketten yapı çıkarımı yazılım platformu
CENGİZ HÜROĞLU
Yüksek Lisans
İngilizce
2014
Elektrik ve Elektronik Mühendisliği Özyeğin Üniversitesi
Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. ARİF TANJU ERDEM

Geri Dön