Geri Dön

Derin öğrenme yaklaşımı ile protein reprezantasyonunu temel alan yeni bir varyant etki tahmin modeli

A novel variant effect prediction model based on protein representation with deep learning architecture

  1. Tez No: 865191
  2. Yazar: GÜLBAHAR MERVE ŞILBIR
  3. Danışmanlar: DOÇ. DR. BURÇİN KURT
  4. Tez Türü: Doktora
  5. Konular: Biyoistatistik, Biostatistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: Türkçe
  9. Üniversite: Karadeniz Teknik Üniversitesi
  10. Enstitü: Sağlık Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Biyoistatistik ve Tıp Bilişimi Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 91

Özet

İnsan genomunda fenotip üzerinde zararlı bir etkiye neden olabilecek tek aminoasit varyantları belirlenirken genellikle sekansın evrimsel korunumu ve yapısal özellikleri dikkate alınarak istatistiksel yöntemler ve makine öğrenme algoritmaları gibi hesaplamalı yaklaşımlar kullanılmaktadır. Sunulan tez çalışmasında, yenilikçi varyant etki tahmin yöntemleri olarak adlandırılan derin öğrenme ve doğal dil işleme yöntemleri ile ABL1 proteinine özgü varyantların fenotip üzerindeki zararlı (patojen) veya zararsız (benign) etkisi tahmin edilmeye çalışılmıştır. Geliştirilen tahmin modellerinde UniProt, ClinVar, EVS ve dbSNP veri tabanlarından elde edilen ABL1 varyant verileri kullanılmıştır. Bu veriler tez çalışması kapsamında belirlenen altı farklı senaryoya göre eğitim, doğrulama ve test veri seti olarak bölümlenmiştir. Modellerde girdi olarak kullanılan ABL1 protein sekansı, standart bölümleme ve bölgesel bölümleme gibi farklı bölümleme yöntemlerine göre bölümlenmiştir. Elde edilen bu varyant sekanslar embedding (gömme) reprezantasyon yöntemine göre boyutlandırılmıştır. Modellerin performansları doğruluk, kesinlik, duyarlılık, F ölçütü, özgüllük ve ROC-AUC metriklerine göre değerlendirilmiştir. Geliştirilen tahmin modellerinin senaryolara göre performansları karşılaştırıldığında en yüksek tahmin performansının Evrişim Katmanı modeli ile (AUC: 0.86) elde edildiği görülmüştür. Buna göre, sadece benign varyantların sınıflaması için en başarılı Evrişim Katmanına sahip derin öğrenme modeli kullanılarak benign varyantlar %93 doğrulukla (seçicilik: 0.93) sınıflanabilir. Yapılan tez çalışmasında, ABL1 proteini özelinde protein varyantlarının fenotip üzerindeki zararlı veya zararsız etkisinin tahmini için başarılı bir model geliştirilmiştir.

Özet (Çeviri)

When identifying single amino acid variants in the human genome that may cause a detrimental effect on the phenotype, the evolutionary conservation and structural features of the protein sequence are generally examined. Using such properties of proteins, variant effect prediction can be made with computational approaches such as statistical methods and machine learning algorithms. In this thesis, we tried to predict the pathogenic or benign effects of ABL1 protein-specific variants on the phenotype using deep learning and natural language processing methods, which are called innovative variant effect prediction methods. ABL1 variant data obtained from UniProt, ClinVar, EVS and dbSNP databases were used in the developed prediction models. These data were divided into training, validation and test data sets according to six different scenarios determined within the scope of the thesis study. The ABL1 protein sequence used as input in the models was partitioned according to different partitioning methods such as standard partitioning and regional partitioning. These obtained variant sequences were sized according to the embedding representation method. The performance of the models was evaluated according to accuracy, precision, recall, F-measure, specificity and ROC-AUC metrics. When the performances of the developed prediction models are compared according to the scenarios, it is seen that the highest prediction performance is achieved with Convolution Layer modeling (AUC: 0.86). Accordingly, benign variants can be classified with 93% accuracy (selectivity: 0.93) by using the deep learning model with the most successful Convolution Layer only for the classification of benign variants. In the thesis study, a successful model was developed to predict the harmful or harmless effects of protein variants, specifically the ABL1 protein, on the phenotype.

Benzer Tezler

  1. Heterojen biyomedikal verinin bilgi çizgeleri ve derin öğrenme tabanlı analizi ile protein fonksiyonlarının otomatik tahmini

    Automated prediction of protein functions with knowledge graph representations and deep learning-based analysis of heterogeneous biomedical data

    ERVA ULUSOY

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe Üniversitesi

    Biyoinformatik Ana Bilim Dalı (Disiplinlerarası)

    DOÇ. DR. TUNCA DOĞAN

  2. Scoring of CERbB2 tumors in breast cancer by pathological image analysis

    Patolojik görüntü analizi ile meme kanserinde CERbB2 tümörlerinin skor değerlerinin belirlenmesi

    GÖZDE AYŞE TATAROĞLU

    Yüksek Lisans

    İngilizce

    İngilizce

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Bilimleri Ana Bilim Dalı

    DOÇ. DR. BEHÇET UĞUR TÖREYİN

  3. Novel centrality, topology and hierarchical-aware link prediction in dynamic networks

    Dinamik ağlarda merkezilik, topoloji ve hiyerarşik tabanlı bağlanti tahmini

    ABUBAKHARI SSERWADDA

    Doktora

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. YUSUF YASLAN

    YRD. DOÇ. ALPER ÖZCAN

  4. Accelerating molecular docking using machine learning methods

    Kenetleme hesaplarının makine öğrenme metotları ile hızlandırılması

    ABDULSALAM YAZID BANDE

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Bilimleri Ana Bilim Dalı

    Assist. Prof. Dr. SEFER BADAY

  5. An innovative and accurate deep learning based HER2 scoring method HER2-unet

    HER2 tümör hücrelerinin segmentasyon için derin öğrenme tabanlı yeni bir yaklaşım

    FARIBA DAMBAND KHAMENEH

    Yüksek Lisans

    İngilizce

    İngilizce

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    PROF. DR. MUSTAFA ERSEL KAMAŞAK