Distance matrices as protein representations
Uzaklık matrislerinin protein reprezantasyonu olarak kullanımı
- Tez No: 756253
- Danışmanlar: PROF. DR. MEHMET VOLKAN ATALAY
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 72
Özet
Herhangi bir veriye dayalı modelin performansı, girdi özniteliklerinde yer alan bilgilerle sınırlı olduğundan, protein dizilerini temsil etmek biyoinformatik alanında çok önemli bir sorundur. Bir proteinin biyolojik işlevi yapısı tarafından belirlenir ve bir proteinin yapısını bilmek, potansiyel olarak ilaç adaylarıyla etkileşimlerini tahmin etmeye veya Gen Ontolojisi (GO) terimini tahmin etmeye yardımcı olabilir. Yine de, mevcut protein gösterimleri bu tür bilgileri içermemektedir zira bilinen milyarlarca protein dizisinin yalnızca küçük bir kısmı deneysel olarak belirlenmiş yapılara sahiptir. Bunun nedeni de bu tür deneyleri yürütmenin maliyetinin oldukça yüksek olmasıdır. Yeni tanıtılan bir sinir ağı tabanlı yapı tahmin modeli AlphaFold, protein yapılarını yüksek doğrulukla tahmin edebildiğini iddia etmektedir. Bu çalışmada, AlphaFold yapı tahminlerinden üretilen iki boyutlu uzaklık matrisleri, iki farklı biyoinformatik problemi modellenirken girdi özniteliği olarak kullanılmıştır; ilaç-hedef etkileşimi tahmini ve Gen Ontolojisi tahmini. Ilaç-hedef etkileşimi tahmin problemi için, halihazırda iki boyutlu protein özelliklerini kullanan son teknoloji bir model, temel olarak kullanılıştır. Daha sonra ablasyon çalışmaları ile uzaklık matrislerinin etkisi gözlemlenmiştir. Ayrıca, aynı model, GO tahmin probleminin üstesinden gelmek için uyarlanmıştır ve başarısı, hazır protein temsilleriyle karşılaştırılmıştır.
Özet (Çeviri)
Representing protein sequences is a crucial problem in the field of bioinformatics since any data-driven model's performance is limited by the information contained in its input features. A protein's biological function is dictated by its structure and knowing a protein's structure can potentially help predict its interactions with drug candidates or predict its Gene Ontology (GO) term. Yet, off-the-shelf protein representations do not contain such information since only a small fraction of the billions of known protein sequences have experimentally determined structures, as the cost of running such experiments is quite high. A newly introduced neural network-based structure prediction model, AlphaFold, claims to be able to predict protein structures with high accuracy. In this study, two-dimensional distance matrices generated from AlphaFold structure predictions are used as input features while modeling two different bioinformatics problems; drug-target interaction (DTI) prediction and Gene Ontology term prediction. For the DTI prediction problem, a state-of-the-art model which already uses two-dimensional protein features, is employed as a baseline. Then, the effect of distance matrices is observed through ablation studies. Moreover, the same model is adapted in order to tackle the GO prediction problem and its success is compared with off-the-shelf protein representations.
Benzer Tezler
- Comparative analysis of brain cell cultures and tissues in alzheimer's disease based on differential expression and gene set enrichment
Alzheımer hastalığında beyin hücresi kültürleri ve dokuların farklı gen anlatımı ve gen seti zenginleştirme yöntemleriyle karşılaştırmalı analizi
HÜSEYİN CAHİT BURDUROĞLU
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiTıp Bilişimi Ana Bilim Dalı
DOÇ. DR. YEŞİM AYDIN SON
- A comparative study on immobilization of Jack Bean urease on different matrices
Jack Bean kaynaklı üreaz enziminin değişik matrislere immobilizasyonu
ABDULLAH SAİD OKUŞLUK
Yüksek Lisans
İngilizce
2023
Biyoteknolojiİstanbul Teknik ÜniversitesiMoleküler Biyoloji-Genetik ve Biyoteknoloji Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ABDULHALİM KILIÇ
- Investigation of the intracellular loop 3 and allosteric mechanisms of β2-adrenergic among G-protein coupled receptors
Β2-adrenergic proteininin allosteri mekanizmalarının ve üçüncü hücre içi ilmiğinin G-protein kenetli proteinler kapsamında incelemesi
EBRU ÇETİN
Yüksek Lisans
İngilizce
2017
BiyofizikKoç ÜniversitesiHesaplamalı Bilimler ve Mühendislik Ana Bilim Dalı
PROF. DR. BURAK ERMAN
PROF. DR. ADEM LEVEND DEMİREL
PROF. DR. TÜRKAN HALİLOĞLU
- Metal iyonlarının 1, 10-ferontrolin ile kompleks oluşturarak kopiler elektroforez yöntemi ile ayrılması ve tayini
Başlık çevirisi yok
AKIN ŞENEL
- Ftir histo-spectroscopic evaluation and chemometric discrimination of colon cancer
Kolon kanserinin ftır hısto-spectroscopıc değerlendirmesi ve kemometrik ayrıştırımı
SUSAN NAJAH MAHDI AL-KINANI
Yüksek Lisans
İngilizce
2020
Biyokimyaİstanbul Teknik ÜniversitesiKimya Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. RAMAZAN KIZIL