Geri Dön

Distance matrices as protein representations

Uzaklık matrislerinin protein reprezantasyonu olarak kullanımı

  1. Tez No: 756253
  2. Yazar: MEHMET DİNÇ
  3. Danışmanlar: PROF. DR. MEHMET VOLKAN ATALAY
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 72

Özet

Herhangi bir veriye dayalı modelin performansı, girdi özniteliklerinde yer alan bilgilerle sınırlı olduğundan, protein dizilerini temsil etmek biyoinformatik alanında çok önemli bir sorundur. Bir proteinin biyolojik işlevi yapısı tarafından belirlenir ve bir proteinin yapısını bilmek, potansiyel olarak ilaç adaylarıyla etkileşimlerini tahmin etmeye veya Gen Ontolojisi (GO) terimini tahmin etmeye yardımcı olabilir. Yine de, mevcut protein gösterimleri bu tür bilgileri içermemektedir zira bilinen milyarlarca protein dizisinin yalnızca küçük bir kısmı deneysel olarak belirlenmiş yapılara sahiptir. Bunun nedeni de bu tür deneyleri yürütmenin maliyetinin oldukça yüksek olmasıdır. Yeni tanıtılan bir sinir ağı tabanlı yapı tahmin modeli AlphaFold, protein yapılarını yüksek doğrulukla tahmin edebildiğini iddia etmektedir. Bu çalışmada, AlphaFold yapı tahminlerinden üretilen iki boyutlu uzaklık matrisleri, iki farklı biyoinformatik problemi modellenirken girdi özniteliği olarak kullanılmıştır; ilaç-hedef etkileşimi tahmini ve Gen Ontolojisi tahmini. Ilaç-hedef etkileşimi tahmin problemi için, halihazırda iki boyutlu protein özelliklerini kullanan son teknoloji bir model, temel olarak kullanılıştır. Daha sonra ablasyon çalışmaları ile uzaklık matrislerinin etkisi gözlemlenmiştir. Ayrıca, aynı model, GO tahmin probleminin üstesinden gelmek için uyarlanmıştır ve başarısı, hazır protein temsilleriyle karşılaştırılmıştır.

Özet (Çeviri)

Representing protein sequences is a crucial problem in the field of bioinformatics since any data-driven model's performance is limited by the information contained in its input features. A protein's biological function is dictated by its structure and knowing a protein's structure can potentially help predict its interactions with drug candidates or predict its Gene Ontology (GO) term. Yet, off-the-shelf protein representations do not contain such information since only a small fraction of the billions of known protein sequences have experimentally determined structures, as the cost of running such experiments is quite high. A newly introduced neural network-based structure prediction model, AlphaFold, claims to be able to predict protein structures with high accuracy. In this study, two-dimensional distance matrices generated from AlphaFold structure predictions are used as input features while modeling two different bioinformatics problems; drug-target interaction (DTI) prediction and Gene Ontology term prediction. For the DTI prediction problem, a state-of-the-art model which already uses two-dimensional protein features, is employed as a baseline. Then, the effect of distance matrices is observed through ablation studies. Moreover, the same model is adapted in order to tackle the GO prediction problem and its success is compared with off-the-shelf protein representations.

Benzer Tezler

  1. Comparative analysis of brain cell cultures and tissues in alzheimer's disease based on differential expression and gene set enrichment

    Alzheımer hastalığında beyin hücresi kültürleri ve dokuların farklı gen anlatımı ve gen seti zenginleştirme yöntemleriyle karşılaştırmalı analizi

    HÜSEYİN CAHİT BURDUROĞLU

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Tıp Bilişimi Ana Bilim Dalı

    DOÇ. DR. YEŞİM AYDIN SON

  2. A comparative study on immobilization of Jack Bean urease on different matrices

    Jack Bean kaynaklı üreaz enziminin değişik matrislere immobilizasyonu

    ABDULLAH SAİD OKUŞLUK

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Biyoteknolojiİstanbul Teknik Üniversitesi

    Moleküler Biyoloji-Genetik ve Biyoteknoloji Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ABDULHALİM KILIÇ

  3. Investigation of the intracellular loop 3 and allosteric mechanisms of β2-adrenergic among G-protein coupled receptors

    Β2-adrenergic proteininin allosteri mekanizmalarının ve üçüncü hücre içi ilmiğinin G-protein kenetli proteinler kapsamında incelemesi

    EBRU ÇETİN

    Yüksek Lisans

    İngilizce

    İngilizce

    2017

    BiyofizikKoç Üniversitesi

    Hesaplamalı Bilimler ve Mühendislik Ana Bilim Dalı

    PROF. DR. BURAK ERMAN

    PROF. DR. ADEM LEVEND DEMİREL

    PROF. DR. TÜRKAN HALİLOĞLU

  4. Ftir histo-spectroscopic evaluation and chemometric discrimination of colon cancer

    Kolon kanserinin ftır hısto-spectroscopıc değerlendirmesi ve kemometrik ayrıştırımı

    SUSAN NAJAH MAHDI AL-KINANI

    Yüksek Lisans

    İngilizce

    İngilizce

    2020

    Biyokimyaİstanbul Teknik Üniversitesi

    Kimya Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. RAMAZAN KIZIL