Geri Dön

Machine learning model for mutation impact prediction based on network properties

Mutasyon etkisi tahmini için ağ özelliklerini içeren makine öğrenme modeli

  1. Tez No: 751520
  2. Yazar: BERK GÜRDAMAR
  3. Danışmanlar: PROF. DR. OSMAN UĞUR SEZERMAN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: İngilizce
  9. Üniversite: Acıbadem Mehmet Ali Aydınlar Üniversitesi
  10. Enstitü: Sağlık Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Biyoistatistik ve Biyoinformatik Ana Bilim Dalı
  12. Bilim Dalı: Biyoistatistik ve Tıp Bilişimi Bilim Dalı
  13. Sayfa Sayısı: 54

Özet

Mutasyon etki tahmini biyoinformatik alanı için zorlu olmaya devam etmektedir. Mutasyonların patojenik veya nötr olarak sınıflandırılması, varyant önceliklendirme, varyantların daha iyi sınıflandırılması ve hastalıkların arkasındaki mekanizmanın daha iyi anlaşılması için önemli bir yaklaşımdır. Bu çalışmanın temel amacı, ağ özelliklerini kullanarak protein yapıları üzerinde mutasyon etkisi tahmini için bir makine öğrenme modeli oluşturmaktı. PDB yapıları 2 farklı atomlar arası etkileşim limiti kullanılarak ve 2 farklı ağ oluşum yaklaşımı kullanılarak ağ yapılarına dönüştürüldü ve 28 farklı makine öğrenme modeli geliştirildi. Ağ tabanlı, gen tabanlı ve amino asit tabanlı olmak üzere 3 alt kategoriye ayrılan 24 farklı özellik, daha iyi tahminler elde etmek için test edildi. Model oluşturma ve test için VariBench ve ClinVar veri setleri, doğrulama ve mevcut 32 farklı yöntemle karşılaştırma için Missense3D veri seti kullanıldı. Metodumuz, Missense3D veri setindeki tahminleriyle 0,9413 alıcı işletim karakteristiği altındaki alan değeri elde ederek diğer 32 metodun hepsinden daha iyi performans gösterdi. predatoR adında, en yüksek performans gösteren 7 angstrom mesafe limiti kullanılan ve bütün atomlar kullanılarak kurulan Adaboost modeli ve 5 angstrom mesafe limiti kullanılan ve sadece karbon alfa atomları kullanılarak kurulan Adaboost modelini içeren bir R paketi oluşturduk. predatoR aynı zamanda girdi veri setine 24 farklı özelliği hesaplamak ve anote etmek için 19 farklı fonksiyon içermektedir. predatoR, topluluğun kullanması için GitHub'da (https://github.com/berkgurdamar/predatoR) mevcuttur.

Özet (Çeviri)

Mutation impact prediction remains challenging for bioinformatics field. Classification of mutations as pathogenic or neutral is an important approach for variant prioritization, better classification of variants and better understanding of the mechanism behind diseases. Main purpose of this study was to build a machine learning model for mutation impact prediction on protein structures by using network properties. We developed 28 different machine learning models by converting PDB structures into networks with using 2 different interatomic interaction cutoffs and 2 different network formalization approach. 24 different features which divided into 3 sub-categories, network-based, gene-based and amino acid-based, were tested for getting better predictions. VariBench and ClinVar datasets were used for model building and testing, Missense3D dataset was used for validation and comparison with currently available 32 different methods. Our method outperformed all the other 32 methods with their predictions on Missense3D dataset with an area under the receiver operating characteristics curve value of 0,9413. We built an R package, predatoR, that contains the highest performed two models which were built with 7 angstrom distance cutoff and all atoms used Adaboost model and 5 angstrom distance cutoff and carbon alpha atoms used Adaboost model. predatoR contains 19 different functions for calculating and annotating 24 different features to the input dataset. predatoR is available on GitHub (https://github.com/berkgurdamar/predatoR) for community to use.

Benzer Tezler

  1. Python söz dizimi hatalarının derin öğrenme yöntemleri ile onarılması

    Fixing python syntax errors with deep learning methods

    SENA DİKİCİ

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBursa Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. TURGAY TUGAY BİLGİN

  2. Development of operation and maintenance strategies for offshore wind industry based on big data management

    Büyük veri yönetimi ile açık deniz rüzgar endüstrisinde işletme ve bakım stratejilerinin geliştirilmesi

    UWE LUETZEN

    Doktora

    İngilizce

    İngilizce

    2024

    Enerjiİstanbul Teknik Üniversitesi

    Gemi ve Deniz Teknoloji Mühendisliği Ana Bilim Dalı

    PROF. DR. SERDAR BEJİ

  3. Destek vektör regresyonu ile PID kontrolör tasarımı

    Design of PID controller via support vector regression

    KEMAL UÇAK

    Yüksek Lisans

    Türkçe

    Türkçe

    2012

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Kontrol ve Otomasyon Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. GÜLAY ÖKE

  4. Computational approaches to study drug resistance mechanisms

    İlaç direnç mekanizmaları için işlemsel yaklaşımlar

    ZOYA KHALID

    Doktora

    İngilizce

    İngilizce

    2017

    BiyolojiSabancı Üniversitesi

    Moleküler Biyoloji-Genetik ve Biyomühendislik Ana Bilim Dalı

    Prof. Dr. İSMAİL ÇAKMAK

  5. Enabling adaptive road lighting through lighting class prediction with real time and historical data

    Gerçek zamanlı ve geçmiş veriye dayanan aydınlatma sınıfı tahmini ile uyarlanabilir yol aydınlatmasının sağlanması

    HASAN MERT TOKGÖZ

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Enerjiİstanbul Teknik Üniversitesi

    Enerji Bilim ve Teknoloji Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MUSTAFA BERKER YURTSEVEN