Proteinlerin subselüler yerleşimlerinin görüntü, sekans ve interaktom verisi tabanlı tahmini
Image, sequence and interactome based prediction of subcellular localization of proteins
- Tez No: 847092
- Danışmanlar: PROF. DR. TUNCA DOĞAN
- Tez Türü: Yüksek Lisans
- Konular: Biyoistatistik, Biyokimya, Biyoteknoloji, Biostatistics, Biochemistry, Biotechnology
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: İngilizce
- Üniversite: Hacettepe Üniversitesi
- Enstitü: Sağlık Bilimleri Enstitüsü
- Ana Bilim Dalı: Biyoenformatik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 99
Özet
Proteinlerin subselüler yerleşimleri (SY) bilgisi, ilaç geliştirme, sistem biyolojisi, proteomik ve fonksiyonel genomik alanlarında önemlidir. Deneysel çalışmalarla ilişkilendirilen yüksek maliyetler nedeniyle, proteinlerin SY'lerini doğru bir şekilde tahmin edecek için hesaplamalı sistemleri geliştirmek gerekli hale gelmiştir. Farklı biyolojik veri türlerinin (örneğin, biyomoleküler diziler, biyomedikal görüntüler, yapılandırılmamış metinler vb.) araştırmacılar için kolayca erişilebilir hale gelmesi, tahminlerin hem performansını hem de kapsamını artırmak için tamamlayıcı veri türlerinden yararlanma olasılığı sunmuştur. Bu çalışmada, protein SY'lerini çok modlu derin öğrenme ile tahmin etmek için HoliLoc adlı yeni bir yöntem önerilmiştir. Yaklaşımımız, protein dil modellerini, çizge öğrenme tekniklerini ve evrişimli ve ileri beslemeli sinir ağlarını kullanarak, 22 farklı kompartıman için proteinlerin SY'lerini tahmin etmek için üç farklı veri türünden yararlanır (2D konfokal mikroskopi görüntüleri, amino asit dizileri ve protein-protein etkileşimleri). Sistem, uçtan uca bir şekilde eğitildi ve performanslar daha önce görülmeyen test veri setinde hesaplandı. Her biri tek bir veri tipini kullanan bireysel modellerin test performansı ortalama 0.18 makro F1 puanı ve 0.55 doğrulukta iken, HoliLoc'un (3 modalitenin birleşimi) gözlemlenen ortalama test performansı 0.26 makro F1 puanı ve 0.60 doğruluk olarak tespit edildi. Bu sonuçlar, önerilen çoklu modlu öğrenme yaklaşımının başarısını göstermektedir. Literatürde mevcut SY tahmincilerine karşı yaptığımız karşılaştırmaya göre, HoliLoc oldukça rekabetçi bir performans sergilemektedir. HoliLoc, yaşam bilimleri araştırmacılarına, ilgilendikleri proteinin subselüler yerleşimlerini doğru bir şekilde tahmin ederek laboratuvar deneyleri için gereken maliyeti ve zamanı azaltacak açık erişimli bir programlama aracı olarak sunulmaktadır.
Özet (Çeviri)
Knowledge of subcellular localization (SL) of proteins is essential for drug development, systems biology, proteomics, and functional genomics. Due to the high costs associated with experimental studies, it has become crucial to develop computational systems to accurately predict proteins' SLs. With different modes of biological data (e.g., biomolecular sequences, biomedical images, unstructured text, etc.) becoming readily available to ordinary scientists, it is possible to leverage complementary types of data to increase both the performance and coverage of predictions. In this study, we propose HoliLoc, a new method for predicting protein SLs via multi-modal deep learning. Our approach makes use of three different types of data (i.e., 2D confocal microscopy images, amino acid sequences, and proteinprotein interactions – PPIs) to predict SLs of proteins in a multi-label manner for 22 different cell compartments using protein language models, graph embeddings and convolutional and feed forward neural networks. The system was trained in an endto-end manner, and the performances were calculated on the unseen hold-out test dataset. The average test performance of individual models (each using a single data type) was 0.18 (macro F1-score) and 0.55 (accuracy), whereas for HoliLoc (the fusion of 3 modalities) it was observed to be 0.26 (F1-score) and 0.60 (accuracy), indicating the effectiveness of the multi-modal learning approach proposed. According to our comparison against state-of-the-art SL predictors, HoliLoc displays highly competitive performance. HoliLoc is distributed as an open-access programmatic tool, which is anticipated to benefit life science researchers by reducing the cost and time required for wet-lab experiments by accurately predicting the SLs of the protein of interest in advance.
Benzer Tezler
- Proteome analysis of Blumeria graminis f. sp. hordei inoculated barley
Blumeria graminis f. sp. hordei ile enfekte edilmiş arpanın proteomik analizi
NEŞE ÖZGAZİ
Yüksek Lisans
İngilizce
2009
BiyoteknolojiOrta Doğu Teknik ÜniversitesiBiyoteknoloji Ana Bilim Dalı
PROF. DR. MAHİNUR AKKAYA
YRD. DOÇ. DR. ASLIHAN GÜNEL
- Farklı kaynaklarda aminopeptidazların dağılımının incelenmesi ve spesifikliklerinin belirlenmesi
Distribution and specificity of aminopeptidases from various sources
EHSAN MONİRİ TORAGAY
- Tip60 geninin demir metabolizmasının düzenlenmesindeki rolünün fare karaciğer dokusunda araştırılması
Investigation of the role of Tip60 gene in the regulation of iron metabolism in mouse liver
NURDAN GÖNÜL
Doktora
Türkçe
2018
BiyokimyaAtatürk ÜniversitesiMoleküler Biyoloji ve Genetik Ana Bilim Dalı
DOÇ. DR. HARUN BUDAK
- Kemik paget hastalığı ve frontotemporal demans ile gözlenen inklüzyon cisimcik miyopati hastalığıyla (IBMPFD) ilişkili bazı vcp mutant proteinlerin rekombinant DNA teknolojisi ile saflaştırılması ve in vitro bağlanma modellerinin incelenmesi
Purification of inclusion body myopathy with paget?s disease of the bone and frontotemporal dementia (IBMPFD) associated some VCP mutant proteins by recombinant dna technology and investigation of the in vitro binding patterns
YALÇIN ERZURUMLU
Yüksek Lisans
Türkçe
2013
BiyokimyaEge ÜniversitesiBiyokimya Ana Bilim Dalı
DOÇ. DR. PETEK BALLAR KIRMIZIBAYRAK
- HMOB2'nin kanser tedavisindeki prediktif rolünün deşifre edilmesi
Describing the predictory role of hMOB2 in cancer treatment
YUSUF TOY