Geri Dön

Proteinlerin subselüler yerleşimlerinin görüntü, sekans ve interaktom verisi tabanlı tahmini

Image, sequence and interactome based prediction of subcellular localization of proteins

  1. Tez No: 847092
  2. Yazar: ECEM KUŞCUOĞLU
  3. Danışmanlar: PROF. DR. TUNCA DOĞAN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Biyoistatistik, Biyokimya, Biyoteknoloji, Biostatistics, Biochemistry, Biotechnology
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: İngilizce
  9. Üniversite: Hacettepe Üniversitesi
  10. Enstitü: Sağlık Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Biyoenformatik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 99

Özet

Proteinlerin subselüler yerleşimleri (SY) bilgisi, ilaç geliştirme, sistem biyolojisi, proteomik ve fonksiyonel genomik alanlarında önemlidir. Deneysel çalışmalarla ilişkilendirilen yüksek maliyetler nedeniyle, proteinlerin SY'lerini doğru bir şekilde tahmin edecek için hesaplamalı sistemleri geliştirmek gerekli hale gelmiştir. Farklı biyolojik veri türlerinin (örneğin, biyomoleküler diziler, biyomedikal görüntüler, yapılandırılmamış metinler vb.) araştırmacılar için kolayca erişilebilir hale gelmesi, tahminlerin hem performansını hem de kapsamını artırmak için tamamlayıcı veri türlerinden yararlanma olasılığı sunmuştur. Bu çalışmada, protein SY'lerini çok modlu derin öğrenme ile tahmin etmek için HoliLoc adlı yeni bir yöntem önerilmiştir. Yaklaşımımız, protein dil modellerini, çizge öğrenme tekniklerini ve evrişimli ve ileri beslemeli sinir ağlarını kullanarak, 22 farklı kompartıman için proteinlerin SY'lerini tahmin etmek için üç farklı veri türünden yararlanır (2D konfokal mikroskopi görüntüleri, amino asit dizileri ve protein-protein etkileşimleri). Sistem, uçtan uca bir şekilde eğitildi ve performanslar daha önce görülmeyen test veri setinde hesaplandı. Her biri tek bir veri tipini kullanan bireysel modellerin test performansı ortalama 0.18 makro F1 puanı ve 0.55 doğrulukta iken, HoliLoc'un (3 modalitenin birleşimi) gözlemlenen ortalama test performansı 0.26 makro F1 puanı ve 0.60 doğruluk olarak tespit edildi. Bu sonuçlar, önerilen çoklu modlu öğrenme yaklaşımının başarısını göstermektedir. Literatürde mevcut SY tahmincilerine karşı yaptığımız karşılaştırmaya göre, HoliLoc oldukça rekabetçi bir performans sergilemektedir. HoliLoc, yaşam bilimleri araştırmacılarına, ilgilendikleri proteinin subselüler yerleşimlerini doğru bir şekilde tahmin ederek laboratuvar deneyleri için gereken maliyeti ve zamanı azaltacak açık erişimli bir programlama aracı olarak sunulmaktadır.

Özet (Çeviri)

Knowledge of subcellular localization (SL) of proteins is essential for drug development, systems biology, proteomics, and functional genomics. Due to the high costs associated with experimental studies, it has become crucial to develop computational systems to accurately predict proteins' SLs. With different modes of biological data (e.g., biomolecular sequences, biomedical images, unstructured text, etc.) becoming readily available to ordinary scientists, it is possible to leverage complementary types of data to increase both the performance and coverage of predictions. In this study, we propose HoliLoc, a new method for predicting protein SLs via multi-modal deep learning. Our approach makes use of three different types of data (i.e., 2D confocal microscopy images, amino acid sequences, and proteinprotein interactions – PPIs) to predict SLs of proteins in a multi-label manner for 22 different cell compartments using protein language models, graph embeddings and convolutional and feed forward neural networks. The system was trained in an endto-end manner, and the performances were calculated on the unseen hold-out test dataset. The average test performance of individual models (each using a single data type) was 0.18 (macro F1-score) and 0.55 (accuracy), whereas for HoliLoc (the fusion of 3 modalities) it was observed to be 0.26 (F1-score) and 0.60 (accuracy), indicating the effectiveness of the multi-modal learning approach proposed. According to our comparison against state-of-the-art SL predictors, HoliLoc displays highly competitive performance. HoliLoc is distributed as an open-access programmatic tool, which is anticipated to benefit life science researchers by reducing the cost and time required for wet-lab experiments by accurately predicting the SLs of the protein of interest in advance.

Benzer Tezler

  1. Proteome analysis of Blumeria graminis f. sp. hordei inoculated barley

    Blumeria graminis f. sp. hordei ile enfekte edilmiş arpanın proteomik analizi

    NEŞE ÖZGAZİ

    Yüksek Lisans

    İngilizce

    İngilizce

    2009

    BiyoteknolojiOrta Doğu Teknik Üniversitesi

    Biyoteknoloji Ana Bilim Dalı

    PROF. DR. MAHİNUR AKKAYA

    YRD. DOÇ. DR. ASLIHAN GÜNEL

  2. Farklı kaynaklarda aminopeptidazların dağılımının incelenmesi ve spesifikliklerinin belirlenmesi

    Distribution and specificity of aminopeptidases from various sources

    EHSAN MONİRİ TORAGAY

    Yüksek Lisans

    Türkçe

    Türkçe

    2013

    BiyokimyaEge Üniversitesi

    Biyokimya Ana Bilim Dalı

    PROF. DR. FİGEN ZİHNİOĞLU

  3. Tip60 geninin demir metabolizmasının düzenlenmesindeki rolünün fare karaciğer dokusunda araştırılması

    Investigation of the role of Tip60 gene in the regulation of iron metabolism in mouse liver

    NURDAN GÖNÜL

    Doktora

    Türkçe

    Türkçe

    2018

    BiyokimyaAtatürk Üniversitesi

    Moleküler Biyoloji ve Genetik Ana Bilim Dalı

    DOÇ. DR. HARUN BUDAK

  4. Kemik paget hastalığı ve frontotemporal demans ile gözlenen inklüzyon cisimcik miyopati hastalığıyla (IBMPFD) ilişkili bazı vcp mutant proteinlerin rekombinant DNA teknolojisi ile saflaştırılması ve in vitro bağlanma modellerinin incelenmesi

    Purification of inclusion body myopathy with paget?s disease of the bone and frontotemporal dementia (IBMPFD) associated some VCP mutant proteins by recombinant dna technology and investigation of the in vitro binding patterns

    YALÇIN ERZURUMLU

    Yüksek Lisans

    Türkçe

    Türkçe

    2013

    BiyokimyaEge Üniversitesi

    Biyokimya Ana Bilim Dalı

    DOÇ. DR. PETEK BALLAR KIRMIZIBAYRAK

  5. HMOB2'nin kanser tedavisindeki prediktif rolünün deşifre edilmesi

    Describing the predictory role of hMOB2 in cancer treatment

    YUSUF TOY

    Doktora

    Türkçe

    Türkçe

    2024

    BiyolojiBingöl Üniversitesi

    Biyoloji Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ RAMAZAN GÜNDOĞDU