Machine learning model for mutation impact prediction based on network properties
Mutasyon etkisi tahmini için ağ özelliklerini içeren makine öğrenme modeli
- Tez No: 751520
- Danışmanlar: PROF. DR. OSMAN UĞUR SEZERMAN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: İngilizce
- Üniversite: Acıbadem Mehmet Ali Aydınlar Üniversitesi
- Enstitü: Sağlık Bilimleri Enstitüsü
- Ana Bilim Dalı: Biyoistatistik ve Biyoinformatik Ana Bilim Dalı
- Bilim Dalı: Biyoistatistik ve Tıp Bilişimi Bilim Dalı
- Sayfa Sayısı: 54
Özet
Mutasyon etki tahmini biyoinformatik alanı için zorlu olmaya devam etmektedir. Mutasyonların patojenik veya nötr olarak sınıflandırılması, varyant önceliklendirme, varyantların daha iyi sınıflandırılması ve hastalıkların arkasındaki mekanizmanın daha iyi anlaşılması için önemli bir yaklaşımdır. Bu çalışmanın temel amacı, ağ özelliklerini kullanarak protein yapıları üzerinde mutasyon etkisi tahmini için bir makine öğrenme modeli oluşturmaktı. PDB yapıları 2 farklı atomlar arası etkileşim limiti kullanılarak ve 2 farklı ağ oluşum yaklaşımı kullanılarak ağ yapılarına dönüştürüldü ve 28 farklı makine öğrenme modeli geliştirildi. Ağ tabanlı, gen tabanlı ve amino asit tabanlı olmak üzere 3 alt kategoriye ayrılan 24 farklı özellik, daha iyi tahminler elde etmek için test edildi. Model oluşturma ve test için VariBench ve ClinVar veri setleri, doğrulama ve mevcut 32 farklı yöntemle karşılaştırma için Missense3D veri seti kullanıldı. Metodumuz, Missense3D veri setindeki tahminleriyle 0,9413 alıcı işletim karakteristiği altındaki alan değeri elde ederek diğer 32 metodun hepsinden daha iyi performans gösterdi. predatoR adında, en yüksek performans gösteren 7 angstrom mesafe limiti kullanılan ve bütün atomlar kullanılarak kurulan Adaboost modeli ve 5 angstrom mesafe limiti kullanılan ve sadece karbon alfa atomları kullanılarak kurulan Adaboost modelini içeren bir R paketi oluşturduk. predatoR aynı zamanda girdi veri setine 24 farklı özelliği hesaplamak ve anote etmek için 19 farklı fonksiyon içermektedir. predatoR, topluluğun kullanması için GitHub'da (https://github.com/berkgurdamar/predatoR) mevcuttur.
Özet (Çeviri)
Mutation impact prediction remains challenging for bioinformatics field. Classification of mutations as pathogenic or neutral is an important approach for variant prioritization, better classification of variants and better understanding of the mechanism behind diseases. Main purpose of this study was to build a machine learning model for mutation impact prediction on protein structures by using network properties. We developed 28 different machine learning models by converting PDB structures into networks with using 2 different interatomic interaction cutoffs and 2 different network formalization approach. 24 different features which divided into 3 sub-categories, network-based, gene-based and amino acid-based, were tested for getting better predictions. VariBench and ClinVar datasets were used for model building and testing, Missense3D dataset was used for validation and comparison with currently available 32 different methods. Our method outperformed all the other 32 methods with their predictions on Missense3D dataset with an area under the receiver operating characteristics curve value of 0,9413. We built an R package, predatoR, that contains the highest performed two models which were built with 7 angstrom distance cutoff and all atoms used Adaboost model and 5 angstrom distance cutoff and carbon alpha atoms used Adaboost model. predatoR contains 19 different functions for calculating and annotating 24 different features to the input dataset. predatoR is available on GitHub (https://github.com/berkgurdamar/predatoR) for community to use.
Benzer Tezler
- Python söz dizimi hatalarının derin öğrenme yöntemleri ile onarılması
Fixing python syntax errors with deep learning methods
SENA DİKİCİ
Yüksek Lisans
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBursa Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. TURGAY TUGAY BİLGİN
- Development of operation and maintenance strategies for offshore wind industry based on big data management
Büyük veri yönetimi ile açık deniz rüzgar endüstrisinde işletme ve bakım stratejilerinin geliştirilmesi
UWE LUETZEN
Doktora
İngilizce
2024
Enerjiİstanbul Teknik ÜniversitesiGemi ve Deniz Teknoloji Mühendisliği Ana Bilim Dalı
PROF. DR. SERDAR BEJİ
- Destek vektör regresyonu ile PID kontrolör tasarımı
Design of PID controller via support vector regression
KEMAL UÇAK
Yüksek Lisans
Türkçe
2012
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiKontrol ve Otomasyon Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. GÜLAY ÖKE
- Computational approaches to study drug resistance mechanisms
İlaç direnç mekanizmaları için işlemsel yaklaşımlar
ZOYA KHALID
Doktora
İngilizce
2017
BiyolojiSabancı ÜniversitesiMoleküler Biyoloji-Genetik ve Biyomühendislik Ana Bilim Dalı
Prof. Dr. İSMAİL ÇAKMAK
- Enabling adaptive road lighting through lighting class prediction with real time and historical data
Gerçek zamanlı ve geçmiş veriye dayanan aydınlatma sınıfı tahmini ile uyarlanabilir yol aydınlatmasının sağlanması
HASAN MERT TOKGÖZ
Yüksek Lisans
İngilizce
2024
Enerjiİstanbul Teknik ÜniversitesiEnerji Bilim ve Teknoloji Ana Bilim Dalı
DR. ÖĞR. ÜYESİ MUSTAFA BERKER YURTSEVEN