Geri Dön

Heterojen biyomedikal verinin bilgi çizgeleri ve derin öğrenme tabanlı analizi ile protein fonksiyonlarının otomatik tahmini

Automated prediction of protein functions with knowledge graph representations and deep learning-based analysis of heterogeneous biomedical data

  1. Tez No: 805254
  2. Yazar: ERVA ULUSOY
  3. Danışmanlar: DOÇ. DR. TUNCA DOĞAN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Genetik, Computer Engineering and Computer Science and Control, Genetics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: Türkçe
  9. Üniversite: Hacettepe Üniversitesi
  10. Enstitü: Sağlık Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Biyoinformatik Ana Bilim Dalı (Disiplinlerarası)
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 102

Özet

Proteinlerin hücresel süreçlerdeki rollerinin belirlenmesi, kompleks biyolojik mekanizmaların tam olarak anlaşılması için büyük öneme sahiptir. Pahalı ve zaman alıcı deneysel yöntemlere alternatif olarak geliştirilen fonksiyon tahmini yöntemleri, biyolojik veritabanlarındaki herkese açık veri setlerinden yararlanmaktadır. Mevcut yöntemlerin genellikle tek bir veri türüne dayalı olması, proteinlerin çok yönlü fonksiyonel yapısını yakalama yeteneğini ve tahmin performansını sınırlamaktadır. Geometrik derin öğrenme yöntemlerindeki son gelişmeler, farklı kaynaklardaki çeşitli biyolojik bileşenleri ve ilişkilerini entegre eden heterojen çizgeleri kullanarak bu probleme çözüm olabilecek yeni algoritmalar sunmuştur. Bu tez çalışmasında heterojen çizge bazlı bir derin öğrenme yaklaşımı ve Gene Ontology (GO) tabanlı geniş çaplı protein fonksiyon tahminindeki uygulaması önerilmiştir. Bunun için öncelikle 14 farklı biyomedikal kaynaktan alınan veri kapsamlı bir heterojen bilgi çizgesi olarak entegre edilmiştir. Bu veri seti, çizge sinir ağları (heterojen çizge dönüştürücü mimarisi) ile tahmin modellerinin eğitiminde kullanılmıştır. Karşılaştırma veri setleri üzerinden yapılan performans değerlendirmesi, tüm GO kategorilerinde temel tahmin metodlarına kıyasla yüksek, son teknoloji tahmin modellerine kıyasla karşılaştırılabilir sonuçlara ulaşıldığını göstermiştir. Yüksek bilgi içerikli moleküler fonksiyon terimlerinin tahmininde önerilen model en başarılı üç yöntem arasında yer almıştır. Seçili proteinlere ait fonksiyon tahminlerinin biyolojik anlamlılığını araştıran literatür taramasında, hakkında kısıtlı bilgi bulunan yeni fonksiyonel ilişkilerin tahmin edilebildiği görülmüştür. Bu çalışma, son derece heterojen biyomedikal veri ile geometrik derin öğrenmenin protein fonksiyon tahmininde kullanımını araştırarak literatüre katkıda bulunmaktadır.

Özet (Çeviri)

Proteins are vital for cellular processes, and accurately determining their functions is crucial for understanding complex biological mechanisms. Computational approaches have emerged as alternatives to expensive and time-consuming experimental methods, leveraging publicly available data in biomedical databases to predict protein functions. However, existing methods often rely on a single data type, limiting their ability to capture the multifaceted functional complexity of proteins. Geometric deep learning offer new algorithms that can be utilized to address these issues by integrating diverse biological entities and relationships sourced from multiple databases using heterogeneous graphs. In this thesis study, we propose a heterogeneous graph learning approach and its implementation as a computational method for Gene Ontology (GO) based large-scale protein function prediction. For this, we first constructed a comprehensive biological knowledge graph by obtaining and integrating data from 14 different biomedical databases. Using this dataset, we trained function prediction models using graph neural networks, i.e., the heterogeneous graph transformer architecture. Performance evaluation on benchmark datasets indicated superior performance compared to baseline methods across all GO categories, while achieving comparable results to top predictors. Our model demonstrated excellent performance in predicting high-information-content molecular function terms, ranking among the top three models. To assess the biological relevance of predicted functional relationships, we conducted a use-case study for selected proteins, showcasing our approach's ability to identify unknown functions with limited available information. This study contributes to the existing literature by investigating protein function prediction using geometric deep learning on highly heterogeneous biomedical data.

Benzer Tezler

  1. Integration and analysis of biological data for computational drug discovery

    İşlemsel ilaç keşfi için biyolojik verinin entegrasyonu ve analizi

    HEVAL ATAŞ GÜVENİLİR

    Doktora

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Sağlık Bilişimi Ana Bilim Dalı

    PROF. DR. MEHMET VOLKAN ATALAY

    DOÇ. DR. TUNCA DOĞAN

  2. Predicting disease-gene associations via machine learning

    Makine öğrenmesi ile gen-hastalık ilişkisi tahmini

    OSMAN ONUR KUZUCU

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. TUNCA DOĞAN

  3. Hepatosellüler karsinomda fotodinamik tedavinin potansiyel terapötik etkisinin araştırılması

    Investigation of the potential therapeutic effect of photodynamic therapy in hepatocellular carcinoma

    ÖZGE ÖZTEN

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    BiyomühendislikSakarya Uygulamalı Bilimler Üniversitesi

    Biyomedikal Mühendisliği Ana Bilim Dalı

    DOÇ. DR. FATİH SÖNMEZ

    DOÇ. DR. GAMZE GÜNEY ESKİLER

  4. Human muscle structure-function relation in-vivo using magnetic resonance imaging modalities

    İnsan kasının yapı ve fonksiyon ilişkisinin manyetik rezonans görüntüleme modaliteleri kullanılarak in-vivo değerlendirilmesi

    AGAH KARAKUZU

    Doktora

    İngilizce

    İngilizce

    2022

    Bilim ve TeknolojiBoğaziçi Üniversitesi

    Biyomedikal Mühendisliği Ana Bilim Dalı

    PROF. DR. CAN ALİ YÜCESOY

  5. Permanent magnet design and image reconstruction algorithm for magnetic resonance imaging in inhomogeneous magnetic fields

    Heterojen manyetik alanlarda manyetik rezonans görüntüleme için kalıcı mıknatıs tasarımı ve görüntü oluşturma tekniği geliştirilmesi

    HÜSEYİN YİĞİTLER

    Yüksek Lisans

    İngilizce

    İngilizce

    2006

    Elektrik ve Elektronik MühendisliğiOrta Doğu Teknik Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    PROF.DR. MURAT EYÜBOĞLU