Geri Dön

SARS-CoV-2 proteini ile insan proteini arasindaki etkileşimlerin makine öğrenmesi yöntemleri ile tahmini

Prediction of interactions between SARS-CoV-2 protein and human protein using machine learning methods

  1. Tez No: 726384
  2. Yazar: FİRDES GÜL KORKUT
  3. Danışmanlar: PROF. DR. MURAT GÖK
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: Türkçe
  9. Üniversite: Yalova Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 57

Özet

Dünya genelinde insan sağlığını tehdit eden Kovid-19, 2020 yılında Dünya Sağlık Örgütü (WHO) tarafından salgın hastalık olarak ilan edilmiştir. Kovid-19 hastalığı yayılma hızı ve ölümcül etkisinden dolayı insanlık üzerinde yıkıcı bir etkiye sebep olmuştur. Kovid-19 hastalığı SARS-CoV-2 virüsünün neden olduğu yeni tip korona virüstür. Bulaşıcı hastalıklara karşı çalışmalarda patojen-konakçı etkileşimlerinin belirlenmesi, hastalığa karşı önlem alınmasında büyük önem taşır. Patojen proteinleri, konakçıyı istila etmek için konakçı proteinleri ile etkileşime girer. Konak proteinlerine normal fonksiyonlarını engeller hatta yanlış yönlendirerek ve zayıflatarak bir konağın bağışıklık sistemini tehlikeye atabilirler. Bunun için Patojen-konak arasında varsayılan protein-protein etkileşiminin tahmin edilmesi büyük önem taşımaktadır. Protein-protein etkileşimlerinin belirlenmesi ile virüs proteinlerinin nasıl çalıştığını, nasıl çoğaldıklarını ve hastalığa nasıl neden olduğunun bulunmasında yardımcı olur. Biz de bu çalışmada SARS-CoV-2 virüs proteinlerinin konakçı(insan) proteinler ile etkileşimleri makine öğrenmesi yöntemleri ile tahmin ettik. Çalışmamızda 30.046 negatif ve 20.365 pozitif veriden oluşan bir protein etkileşimli veri seti kullandık. Protein etkileşimleri tahmin etmek için protein dizilimindeki amino asitleri, protein öznitelik kodlama yöntemiyle kodladık. Sınıflandırma algoritmaları olarak Naif Bayes, Bayes Net, k-En Yakın Komşuluğu, Doğrusal Destek Vektör Makineleri, Radyal Destek Vektör Makineleri ve Çok Katmanlı Algılayıcı kullanılmıştır. Sınıflandırma algoritmalarına, öncelikle literatürde yer alan protein öznitelik kodlama yöntemleri ile elde edilen veriler verilmiştir. Daha sonra amino asitlerin sıklık, konum ve kimyasal özellikleri bilgisinin yer aldığı yeni bir yöntem geliştirildi. Geliştirilen yöntem ile literatürdeki yöntemlerin sınıflandırma sonuçları karşılaştırıldığında daha dengeli sonuçlar sağlamıştır. Elde ettiğimiz deneysel sonuçlara göre geliştirdiğimiz yöntem Naif Bayes ve Bayes Ağları sınıflandırma algoritmaları ile 0,513 doğruluk, 0,529 duyarlık, 0,471 özgünlük, 0.514 kesinlik, 0,514 F1-skor, 0,027 Kappa değeri vermiştir.

Özet (Çeviri)

Covid-19, which threatens human health worldwide, was declared an epidemic disease by the World Health Organization (WHO) in 2020. Covid-19 disease has had a devastating effect on humanity due to its spread rate and deadly effect. Covid-19 disease is a new type of corona virus caused by the SARS-CoV-2 virus. In this study, we predicted the interactions of SARS-CoV-2 virus proteins with host (human) proteins using machine learning methods. Determination of pathogen-host interactions in studies against infectious diseases is of great importance in taking precautions against the disease. Pathogen proteins interact with host proteins to invade the host. They can interfere with the normal function of host proteins or even compromise a host's immune system by misdirecting and weakening it. For this, it is of great importance to predict the putative protein-protein interaction between the pathogen-host. Identifying protein-protein interactions helps to find out how virus proteins work, how they replicate, and how they cause disease. In our study, we used a protein interaction dataset consisting of 30,046 negative and 20,365 positive data. To predict protein interactions, we encoded amino acids in the protein sequence using the protein feature coding method. Naive Bayes, Bayes Net, k-Nearest Neighborhood, Linear Support Vector Machines, Radial Support Vector Machines and Multilayer Perceptron were used as classification algorithms. Firstly, the data obtained by protein feature coding methods in the literature are given to the classification algorithms. Then, a new method was developed that includes the frequency, location and chemical properties of amino acids. When the classification results of the developed method and the methods in the literature were compared, more balanced results were obtained. The method we developed according to the experimental results we obtained gave 0.513 accuracy, 0.529 sensitivity, 0.471 specificity, 0.514 precision, 0.514 F1-score, 0.027 Kappa values with Naive Bayes and Bayes Networks classification algorithms.

Benzer Tezler

  1. Variant detection in inflammatory diseases

    İnflamatuvar hastalıklarda varyant belirlenmesi

    GİZEM ALKURT

    Doktora

    İngilizce

    İngilizce

    2024

    Biyolojiİstanbul Teknik Üniversitesi

    Moleküler Biyoloji-Genetik ve Biyoteknoloji Ana Bilim Dalı

    PROF. DR. GİZEM DİNLER DOĞANAY

  2. Generation of plasmid-based eukaryotic model to investigate biology of Crimean-Congo hemorrhagic fever virus nucleoprotein and glycoproteins

    Kırım Kongo kanamalı ateşi virüsü nükleoproteinin ve glikoproteinlerinin biyolojisinin çalışılmasında plazmit temelli ökaryotik model oluşturulması

    NESİBE SELMA ÇETİN

    Doktora

    İngilizce

    İngilizce

    2023

    BiyoteknolojiBezm-i Alem Vakıf Üniversitesi

    Biyoteknoloji Ana Bilim Dalı

    PROF. DR. MEHMET ZİYA DOYMAZ

  3. Predicting novel small inhibitors of SARS-CoV-2: Targeting SARS-CoV-2 spike protein, human ACE2 protein and SARS-CoV-2 NsP16 via molecular docking

    SARS-CoV-2 için yeni küçük inhibitör moleküllerin tahmini: Moleküler yanaştırma yöntemiyle SARS-CoV-2 spike proteini, insan ACE2 proteini ve SARS-CoV-2 NsP16 hedeflenmesi

    ONUR ÖZER

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Biyolojiİstanbul Teknik Üniversitesi

    Moleküler Biyoloji-Genetik ve Biyoteknoloji Ana Bilim Dalı

    DOÇ. DR. MERT GÜR

    DR. ÖĞR. ÜYESİ SEFER BADAY

  4. Exploring allosteric mechanisms of chemokine receptor CXCR4 and implications in drug design

    Kemokin reseptörü CXCR4'ün allosterik mekanizmalarının ve ilaç tasarımındaki uygulamalarının keşfedilmesi

    TUĞÇE İNAN

    Doktora

    İngilizce

    İngilizce

    2023

    Kimya Mühendisliğiİstanbul Teknik Üniversitesi

    Kimya Mühendisliği Ana Bilim Dalı

    DOÇ. DR. AYŞE ÖZGE KÜRKÇÜOĞLU LEVİTAS

  5. Design of short peptides targeting the interaction between SARS-CoV-2 and human ACE2

    SARS-CoV-2 spike ve insan ACE2 arasındaki etkileşimi hedefleyen kısa peptitlerin tasarımı

    NUMAN NUSRET USTA

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilim ve Teknolojiİstanbul Teknik Üniversitesi

    Hesaplamalı Bilimler ve Mühendislik Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ SEFER BADAY