Heterojen biyomedikal verinin bilgi çizgeleri ve derin öğrenme tabanlı analizi ile protein fonksiyonlarının otomatik tahmini
Automated prediction of protein functions with knowledge graph representations and deep learning-based analysis of heterogeneous biomedical data
- Tez No: 805254
- Danışmanlar: DOÇ. DR. TUNCA DOĞAN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Genetik, Computer Engineering and Computer Science and Control, Genetics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: Türkçe
- Üniversite: Hacettepe Üniversitesi
- Enstitü: Sağlık Bilimleri Enstitüsü
- Ana Bilim Dalı: Biyoinformatik Ana Bilim Dalı (Disiplinlerarası)
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 102
Özet
Proteinlerin hücresel süreçlerdeki rollerinin belirlenmesi, kompleks biyolojik mekanizmaların tam olarak anlaşılması için büyük öneme sahiptir. Pahalı ve zaman alıcı deneysel yöntemlere alternatif olarak geliştirilen fonksiyon tahmini yöntemleri, biyolojik veritabanlarındaki herkese açık veri setlerinden yararlanmaktadır. Mevcut yöntemlerin genellikle tek bir veri türüne dayalı olması, proteinlerin çok yönlü fonksiyonel yapısını yakalama yeteneğini ve tahmin performansını sınırlamaktadır. Geometrik derin öğrenme yöntemlerindeki son gelişmeler, farklı kaynaklardaki çeşitli biyolojik bileşenleri ve ilişkilerini entegre eden heterojen çizgeleri kullanarak bu probleme çözüm olabilecek yeni algoritmalar sunmuştur. Bu tez çalışmasında heterojen çizge bazlı bir derin öğrenme yaklaşımı ve Gene Ontology (GO) tabanlı geniş çaplı protein fonksiyon tahminindeki uygulaması önerilmiştir. Bunun için öncelikle 14 farklı biyomedikal kaynaktan alınan veri kapsamlı bir heterojen bilgi çizgesi olarak entegre edilmiştir. Bu veri seti, çizge sinir ağları (heterojen çizge dönüştürücü mimarisi) ile tahmin modellerinin eğitiminde kullanılmıştır. Karşılaştırma veri setleri üzerinden yapılan performans değerlendirmesi, tüm GO kategorilerinde temel tahmin metodlarına kıyasla yüksek, son teknoloji tahmin modellerine kıyasla karşılaştırılabilir sonuçlara ulaşıldığını göstermiştir. Yüksek bilgi içerikli moleküler fonksiyon terimlerinin tahmininde önerilen model en başarılı üç yöntem arasında yer almıştır. Seçili proteinlere ait fonksiyon tahminlerinin biyolojik anlamlılığını araştıran literatür taramasında, hakkında kısıtlı bilgi bulunan yeni fonksiyonel ilişkilerin tahmin edilebildiği görülmüştür. Bu çalışma, son derece heterojen biyomedikal veri ile geometrik derin öğrenmenin protein fonksiyon tahmininde kullanımını araştırarak literatüre katkıda bulunmaktadır.
Özet (Çeviri)
Proteins are vital for cellular processes, and accurately determining their functions is crucial for understanding complex biological mechanisms. Computational approaches have emerged as alternatives to expensive and time-consuming experimental methods, leveraging publicly available data in biomedical databases to predict protein functions. However, existing methods often rely on a single data type, limiting their ability to capture the multifaceted functional complexity of proteins. Geometric deep learning offer new algorithms that can be utilized to address these issues by integrating diverse biological entities and relationships sourced from multiple databases using heterogeneous graphs. In this thesis study, we propose a heterogeneous graph learning approach and its implementation as a computational method for Gene Ontology (GO) based large-scale protein function prediction. For this, we first constructed a comprehensive biological knowledge graph by obtaining and integrating data from 14 different biomedical databases. Using this dataset, we trained function prediction models using graph neural networks, i.e., the heterogeneous graph transformer architecture. Performance evaluation on benchmark datasets indicated superior performance compared to baseline methods across all GO categories, while achieving comparable results to top predictors. Our model demonstrated excellent performance in predicting high-information-content molecular function terms, ranking among the top three models. To assess the biological relevance of predicted functional relationships, we conducted a use-case study for selected proteins, showcasing our approach's ability to identify unknown functions with limited available information. This study contributes to the existing literature by investigating protein function prediction using geometric deep learning on highly heterogeneous biomedical data.
Benzer Tezler
- Integration and analysis of biological data for computational drug discovery
İşlemsel ilaç keşfi için biyolojik verinin entegrasyonu ve analizi
HEVAL ATAŞ GÜVENİLİR
Doktora
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiSağlık Bilişimi Ana Bilim Dalı
PROF. DR. MEHMET VOLKAN ATALAY
DOÇ. DR. TUNCA DOĞAN
- Predicting disease-gene associations via machine learning
Makine öğrenmesi ile gen-hastalık ilişkisi tahmini
OSMAN ONUR KUZUCU
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. TUNCA DOĞAN
- Hepatosellüler karsinomda fotodinamik tedavinin potansiyel terapötik etkisinin araştırılması
Investigation of the potential therapeutic effect of photodynamic therapy in hepatocellular carcinoma
ÖZGE ÖZTEN
Yüksek Lisans
Türkçe
2021
BiyomühendislikSakarya Uygulamalı Bilimler ÜniversitesiBiyomedikal Mühendisliği Ana Bilim Dalı
DOÇ. DR. FATİH SÖNMEZ
DOÇ. DR. GAMZE GÜNEY ESKİLER
- Human muscle structure-function relation in-vivo using magnetic resonance imaging modalities
İnsan kasının yapı ve fonksiyon ilişkisinin manyetik rezonans görüntüleme modaliteleri kullanılarak in-vivo değerlendirilmesi
AGAH KARAKUZU
Doktora
İngilizce
2022
Bilim ve TeknolojiBoğaziçi ÜniversitesiBiyomedikal Mühendisliği Ana Bilim Dalı
PROF. DR. CAN ALİ YÜCESOY
- Permanent magnet design and image reconstruction algorithm for magnetic resonance imaging in inhomogeneous magnetic fields
Heterojen manyetik alanlarda manyetik rezonans görüntüleme için kalıcı mıknatıs tasarımı ve görüntü oluşturma tekniği geliştirilmesi
HÜSEYİN YİĞİTLER
Yüksek Lisans
İngilizce
2006
Elektrik ve Elektronik MühendisliğiOrta Doğu Teknik ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
PROF.DR. MURAT EYÜBOĞLU