SARS-CoV-2 proteini ile insan proteini arasindaki etkileşimlerin makine öğrenmesi yöntemleri ile tahmini
Prediction of interactions between SARS-CoV-2 protein and human protein using machine learning methods
- Tez No: 726384
- Danışmanlar: PROF. DR. MURAT GÖK
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: Türkçe
- Üniversite: Yalova Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
- Sayfa Sayısı: 57
Özet
Dünya genelinde insan sağlığını tehdit eden Kovid-19, 2020 yılında Dünya Sağlık Örgütü (WHO) tarafından salgın hastalık olarak ilan edilmiştir. Kovid-19 hastalığı yayılma hızı ve ölümcül etkisinden dolayı insanlık üzerinde yıkıcı bir etkiye sebep olmuştur. Kovid-19 hastalığı SARS-CoV-2 virüsünün neden olduğu yeni tip korona virüstür. Bulaşıcı hastalıklara karşı çalışmalarda patojen-konakçı etkileşimlerinin belirlenmesi, hastalığa karşı önlem alınmasında büyük önem taşır. Patojen proteinleri, konakçıyı istila etmek için konakçı proteinleri ile etkileşime girer. Konak proteinlerine normal fonksiyonlarını engeller hatta yanlış yönlendirerek ve zayıflatarak bir konağın bağışıklık sistemini tehlikeye atabilirler. Bunun için Patojen-konak arasında varsayılan protein-protein etkileşiminin tahmin edilmesi büyük önem taşımaktadır. Protein-protein etkileşimlerinin belirlenmesi ile virüs proteinlerinin nasıl çalıştığını, nasıl çoğaldıklarını ve hastalığa nasıl neden olduğunun bulunmasında yardımcı olur. Biz de bu çalışmada SARS-CoV-2 virüs proteinlerinin konakçı(insan) proteinler ile etkileşimleri makine öğrenmesi yöntemleri ile tahmin ettik. Çalışmamızda 30.046 negatif ve 20.365 pozitif veriden oluşan bir protein etkileşimli veri seti kullandık. Protein etkileşimleri tahmin etmek için protein dizilimindeki amino asitleri, protein öznitelik kodlama yöntemiyle kodladık. Sınıflandırma algoritmaları olarak Naif Bayes, Bayes Net, k-En Yakın Komşuluğu, Doğrusal Destek Vektör Makineleri, Radyal Destek Vektör Makineleri ve Çok Katmanlı Algılayıcı kullanılmıştır. Sınıflandırma algoritmalarına, öncelikle literatürde yer alan protein öznitelik kodlama yöntemleri ile elde edilen veriler verilmiştir. Daha sonra amino asitlerin sıklık, konum ve kimyasal özellikleri bilgisinin yer aldığı yeni bir yöntem geliştirildi. Geliştirilen yöntem ile literatürdeki yöntemlerin sınıflandırma sonuçları karşılaştırıldığında daha dengeli sonuçlar sağlamıştır. Elde ettiğimiz deneysel sonuçlara göre geliştirdiğimiz yöntem Naif Bayes ve Bayes Ağları sınıflandırma algoritmaları ile 0,513 doğruluk, 0,529 duyarlık, 0,471 özgünlük, 0.514 kesinlik, 0,514 F1-skor, 0,027 Kappa değeri vermiştir.
Özet (Çeviri)
Covid-19, which threatens human health worldwide, was declared an epidemic disease by the World Health Organization (WHO) in 2020. Covid-19 disease has had a devastating effect on humanity due to its spread rate and deadly effect. Covid-19 disease is a new type of corona virus caused by the SARS-CoV-2 virus. In this study, we predicted the interactions of SARS-CoV-2 virus proteins with host (human) proteins using machine learning methods. Determination of pathogen-host interactions in studies against infectious diseases is of great importance in taking precautions against the disease. Pathogen proteins interact with host proteins to invade the host. They can interfere with the normal function of host proteins or even compromise a host's immune system by misdirecting and weakening it. For this, it is of great importance to predict the putative protein-protein interaction between the pathogen-host. Identifying protein-protein interactions helps to find out how virus proteins work, how they replicate, and how they cause disease. In our study, we used a protein interaction dataset consisting of 30,046 negative and 20,365 positive data. To predict protein interactions, we encoded amino acids in the protein sequence using the protein feature coding method. Naive Bayes, Bayes Net, k-Nearest Neighborhood, Linear Support Vector Machines, Radial Support Vector Machines and Multilayer Perceptron were used as classification algorithms. Firstly, the data obtained by protein feature coding methods in the literature are given to the classification algorithms. Then, a new method was developed that includes the frequency, location and chemical properties of amino acids. When the classification results of the developed method and the methods in the literature were compared, more balanced results were obtained. The method we developed according to the experimental results we obtained gave 0.513 accuracy, 0.529 sensitivity, 0.471 specificity, 0.514 precision, 0.514 F1-score, 0.027 Kappa values with Naive Bayes and Bayes Networks classification algorithms.
Benzer Tezler
- Variant detection in inflammatory diseases
İnflamatuvar hastalıklarda varyant belirlenmesi
GİZEM ALKURT
Doktora
İngilizce
2024
Biyolojiİstanbul Teknik ÜniversitesiMoleküler Biyoloji-Genetik ve Biyoteknoloji Ana Bilim Dalı
PROF. DR. GİZEM DİNLER DOĞANAY
- Generation of plasmid-based eukaryotic model to investigate biology of Crimean-Congo hemorrhagic fever virus nucleoprotein and glycoproteins
Kırım Kongo kanamalı ateşi virüsü nükleoproteinin ve glikoproteinlerinin biyolojisinin çalışılmasında plazmit temelli ökaryotik model oluşturulması
NESİBE SELMA ÇETİN
Doktora
İngilizce
2023
BiyoteknolojiBezm-i Alem Vakıf ÜniversitesiBiyoteknoloji Ana Bilim Dalı
PROF. DR. MEHMET ZİYA DOYMAZ
- Predicting novel small inhibitors of SARS-CoV-2: Targeting SARS-CoV-2 spike protein, human ACE2 protein and SARS-CoV-2 NsP16 via molecular docking
SARS-CoV-2 için yeni küçük inhibitör moleküllerin tahmini: Moleküler yanaştırma yöntemiyle SARS-CoV-2 spike proteini, insan ACE2 proteini ve SARS-CoV-2 NsP16 hedeflenmesi
ONUR ÖZER
Yüksek Lisans
İngilizce
2022
Biyolojiİstanbul Teknik ÜniversitesiMoleküler Biyoloji-Genetik ve Biyoteknoloji Ana Bilim Dalı
DOÇ. DR. MERT GÜR
DR. ÖĞR. ÜYESİ SEFER BADAY
- Exploring allosteric mechanisms of chemokine receptor CXCR4 and implications in drug design
Kemokin reseptörü CXCR4'ün allosterik mekanizmalarının ve ilaç tasarımındaki uygulamalarının keşfedilmesi
TUĞÇE İNAN
Doktora
İngilizce
2023
Kimya Mühendisliğiİstanbul Teknik ÜniversitesiKimya Mühendisliği Ana Bilim Dalı
DOÇ. DR. AYŞE ÖZGE KÜRKÇÜOĞLU LEVİTAS
- Design of short peptides targeting the interaction between SARS-CoV-2 and human ACE2
SARS-CoV-2 spike ve insan ACE2 arasındaki etkileşimi hedefleyen kısa peptitlerin tasarımı
NUMAN NUSRET USTA
Yüksek Lisans
İngilizce
2023
Bilim ve Teknolojiİstanbul Teknik ÜniversitesiHesaplamalı Bilimler ve Mühendislik Ana Bilim Dalı
DR. ÖĞR. ÜYESİ SEFER BADAY