Çizge katıştırma ve fenotip benzerlik tabanlı hibrit gen önceliklendirme yöntemi
Hybrid gene prioritization method based on graph embedding and phenotype similarity
- Tez No: 895530
- Danışmanlar: DOÇ. DR. YAKUP GENÇ, PROF. DR. FATİH ERDOĞAN SEVİLGEN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: Türkçe
- Üniversite: Gebze Teknik Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 54
Özet
Genetik hastalıkların teşhisi için kullanılan gen önceliklendirme bilgisayar mühendisliği ve genetik bilimi disiplinlerinin odak noktasındaki güncel ve gelişmekte olan bir araştırma konusudur. Gen önceliklendirme çok sayıda gen arasından hastalığa neden olma olasılığı en yüksek genleri belirlemeyi amaçlar. Bu alanda benzerlik tabanlı veya katıştırma tabanlı yöntemler üzerinde çalışılmıştır. Bu tez kapsamında, çizge katıştırma ve fenotip benzerlik tekniklerini birleştirerek gen önceliklendirme başarımını arttırmak hedeflenmektedir. Bu amaçla GRATE (Gene Ranking by Averaging Top gene-related phenotype scores using HPO Embeddings / HPO Katıştırmalarını Kullananarak En İyi Fenotip Puanlarının Ortalamasını Alan Gen Sıralaması) ismi verilen yeni bir hibrit yöntem önerilmiştir. GRATE'in diğer katıştırma tabanlı yöntemlerden farkı, doğrudan gen ve fenotip katıştırmaları arasında karşılaştırma yapmak yerine, fenotip kümesi karşılaştırması kullanmasıdır. GRATE'in doğruluk oranını arttırmak amacıyla“Average-N”ve“IC-N”adını verdiğimiz iki yeni teknik uygulanmaktadır. Average-N tekniğinde her bir hasta fenotipinin gen benzerliği hesaplanırken, gen-ilişkili fenotip kümesindeki en yüksek puana sahip N fenotip dikkate alınmaktadır. IC-N stratejisinde ise, Average-N yaklaşımına ek olarak benzerlik değerleri bilgi içeriği (Information Content) değerleri ile ağırlıklandırılmaktadır. GRATE'de HPO içindeki hiyerarşik yapı ve fenotip terimlerinin gen anotasyonları kullanılarak katıştırma oluşturulmaktadır. GRATE, ClinVar gönderimlerinden elde edilen iki veri kümesi üzerinde test edilerek başarımını güncel yöntemlerle karşılaştırılmıştır. Sonuçlar, çalışma kapsamında geliştirilen yöntemin literatürdeki yöntemlerden daha iyi başarım gösterdiğini ortaya koymaktadır. Ayrıca, GRATE küme karşılaştırması yapması sayesinde yüksek açıklanabilirlik sağlamaktadır. Yüksek açıklanabilirlik, sonuçların alanın uzmanları tarafından daha kolay doğrulanmasını sağlar. Bu özellikleri ile, geliştirilen bu hibrid gen önceliklendirme yöntemi, kritik genlerin tespit edilmesi ile genetik hastalıkların teşhisine önemli ölçüde katkıda bulunacaktır.
Özet (Çeviri)
The gene prioritization for diagnosing genetic diseases is a current and evolving research topic at the intersection of computer engineering and genetic science disciplines. The gene prioritization aims to identify genes with the highest probability of causing a disease among numerous genes. In this field, phenotype similarity-based or embedding-based methods have been studied. This thesis aims to improve gene prioritization performance by combining graph embedding and phenotype similarity techniques. For this purpose, a new hybrid method called GRATE (Gene Ranking by Averaging Top gene-related phenotype scores using HPO Embeddings) is proposed. The difference between GRATE and other embedding-based methods is that it uses phenotype set comparison instead of directly comparing gene and phenotype embeddings. To increase the accuracy rate of GRATE, two new techniques called“Average-N”and“IC-N”are applied. In the Average-N technique, when calculating the gene similarity of each patient phenotype, the N phenotypes with the highest scores in the gene-related phenotype set are considered. In the IC-N strategy, in addition to the Average-N approach, similarity values are weighted with information content (IC) values. In GRATE, embeddings are created using the hierarchical structure within HPO and the phenotype-gene associations. GRATE was tested on two datasets obtained from ClinVar submissions, and its performance was compared with current methods. The results show that the method developed within the scope of the study performs better than the methods in the literature. Additionally, GRATE provides high explainability due to its set comparison approach. High explainability allows for easier verification of results by domain experts. With these features, this hybrid gene prioritization method will contribute significantly to the diagnosis of genetic diseases by identifying critical genes.
Benzer Tezler
- Real-time parameterized locomotion generation
Gerçek zamanlı parametrik gezme hareketi türetilmesi
MUZAFFER AKBAY
Yüksek Lisans
İngilizce
2008
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent ÜniversitesiBilgisayar Mühendisliği Bölümü
DOÇ. DR. UĞUR GÜDÜKBAY
- A variational graph autoencoder for manipulation action recognition and prediction
Manipülasyon aksiyon tanıma ve tahminleme için değişimsel çizge otokodlayıcısı
GAMZE AKYOL
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. SANEM SARIEL UZER
DOÇ. DR. EREN ERDAL AKSOY
- Özgül öğrenme bozukluğu tanısı almış hastalarda DCDC2 ve DYX1C1 genlerinin yeni nesil dizi analizi yöntemiyle incelenmesi
Investigation of DCDC2 and DYX1C1 genes using next generation sequencing analysis in patients diagnosed with specific learning disorders
SÜMEYRA ELİF KAPLAN KARAKAYA
Tıpta Uzmanlık
Türkçe
2020
PsikiyatriDüzce ÜniversitesiÇocuk ve Ergen Psikiyatrisi Ana Bilim Dalı
DOÇ. DR. ÇİĞDEM YEKTAŞ
- Effects of anti-scratch additives on the properties of polypropylenes
Çizilmezlik katkılarının polipropilenin özelliklerine etkisi
HİLAL GÜNEYSU
Yüksek Lisans
İngilizce
2014
Polimer Bilim ve Teknolojisiİstanbul Teknik ÜniversitesiPolimer Bilim ve Teknolojisi Ana Bilim Dalı
PROF. NURSELİ UYANIK
DOÇ. DR. GÜRALP ÖZKOÇ
- İlkokul öğrencilerinin yazma hatalarının düzeltilmesi: Bir eylem araştırması
Correcting primary school students' writing errors: An action research
SEMA EKMEKCİ
Yüksek Lisans
Türkçe
2022
Eğitim ve Öğretimİnönü ÜniversitesiTemel Eğitim Ana Bilim Dalı
DOÇ. DR. BAŞAK KASA AYTEN