Geri Dön

Anti-koronavirüs peptitlerinin protein kodlama yöntemleri ile tespiti

Determination of anti-coronavirus peptides by protein coding methods

  1. Tez No: 720340
  2. Yazar: HASİBE CANDAN
  3. Danışmanlar: PROF. DR. MURAT GÖK
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Kovid-19, Terapötik ajan, Öznitelik kodlama, Sınıflandırma, Makine öğrenmesi, Covid-19, Therapeutic agent, Feature encoding, Classification, Machine learning
  7. Yıl: 2022
  8. Dil: Türkçe
  9. Üniversite: Yalova Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 69

Özet

Patojenler canlılar üzerine yerleşir ve kendi proteinlerini canlının hücre çekirdeğine bırakarak protein yapısını bozar. Bozulan protein, fonksiyonlarını gerçekleştiremez ve canlının biyolojik işleyişi aksar. Patojenin canlı üzerine yerleşip çoğalmasıyla salgın hastalıklar ortaya çıkar. Günümüzde büyük bir salgına dönüşen Kovid-19 hastalığı, dünya çapında kitlesel can kayıplarına yol açmaktadır. Hastalığa karşı aşının keşfi Kovid-19 hastalığının önlenmesinde kesin sonuç verememiştir. İlaç geliştirme çalışmaları devam etmektedir. Biyoenformatik ve makine öğrenmesi temelli çalışmalar ilaç gelişimine büyük katkı sağlamaktadır. Anti-koronavirüs (anti-CoV) peptitler, koronavirüsün inhibe edilmesini ve koronavirüsün zararlarının ortadan kaldırılmasını sağlayan bir tür terapötik ajandır. Anti-CoV peptit dizilimlerinin makine öğrenmesi yöntemleri ile tahmin edilmesi, koronavirüs hastalığının tedavisi ve ilaç gelişimi adımları için oldukça önemlidir. Ancak anti-CoV peptitleri diğer peptitlerden ayırt etme in vivo ya da in vitro ortamlarda çok daha fazla maliyet ve zaman gerektirir. Bu nedenle makine öğrenmesi temelli çalışmalar ile bilgisayar ortamında modellenerek tahmin edilmesi daha avantajlıdır. Bu tez çalışmasında, Kovid-19'a karşı terapötik ajan olan anti-CoV peptit dizilimlerinin yüksek doğrulukla tahmin edilebilmesi için protein verilerinin, protein kodlama yöntemleri ile sayısallaştırılması amaçlanmaktadır. Bu minvalde, 2gBLO ve 2gBLOTVD isimli iki yeni protein kodlama yöntemi geliştirilmiştir. Anti-CoV peptit veri seti pozitif sınıf, antimikrobiyal (AMP), antimikrobiyal olmayan (non-AMP) ve antivirüsal olmayan (non-AVP) üç adet negatif sınıf peptit veri seti kullanılmıştır. Bu protein verileri pozitif anti-CoV olacak şekilde her bir negatif veri seti ile ayrı ayrı birleştirilerek üç adet negatif ve pozitif sınıfa sahip veri setleri elde edilmiştir. Veri setleri geliştirilen protein kodlama yöntemleriyle sayısallaştırılmıştır. 2gBLO yöntemi, digram metodu kullanılarak kodlanmakta olan her bir dizilimdeki amino asit ikilisinin BLOSUM62 matrisindeki yer değiştirme değeri ile çarpılarak güncellenmesi sonucu elde edilmektedir. 2gBLOTVD yöntemi ise, Taylor'ın Venn diyagramındaki ortak fiziko kimyasal özellik sayısı ile 2gBLO yönteminden elde edilen değer çarpılmaktadır. Pozitif sınıf olan anti-CoV peptit veri setindeki örnek azlığı sebebiyle, dengesiz olan veri setleri, başarım değerlerini yükseltmek amacıyla, sınıf dengeleme işlemine tabi tutulmuştur. Ayrıca, sınıflandırma sonuçlarının etkisini artırmak için, ayrıklaştırma yöntemi uygulanarak başarım metrikleri, Naif Bayes, Bayes Ağları, Rastgele Orman, Doğrusal Destek Vektör Makineleri (Doğrusal DVM), Radyal Destek Vektör Makineleri (Radyal DVM), k-En Yakın Komşuluk (k-EYK), Çok Katmanlı Algılayıcı (ÇKA) ve Lojistik Regresyon sınıflandırıcı algoritmaları ile elde edilmiştir. Elde edilen deneysel sonuçlara göre; sınıflandırıcı algoritmalar üzerinde geliştirilen protein kodlama yöntemlerinin, literatürde öne çıkan protein kodlama yöntemlerinden daha yüksek başarım verdiği görülmektedir.

Özet (Çeviri)

Pathogens settle on living beings and leave their own proteins in the cell nucleus of the host, disrupting the protein structure. The deteriorated protein cannot perform its functions and the biological functioning of the living being is disrupted. Epidemics occur when the pathogen settles and multiplies on the living being. Today, the Covid-19 disease, which has turned into a major epidemic, causes mass casualties around the world. The discovery of the vaccine against coronavirus could not give definite results in the prevention of the Covid-19 disease. Hence, drug development studies go on all over the world. Bioinformatics and machine learning-based studies make a great contribution to drug development for the Covid-19. Anti-coronavirus (anti-CoV) peptides are a kind of therapeutic agent that inhibits the coronavirus and eliminates the harms of the coronavirus. Prediction of anti-CoV peptide sequences with machine learning methods is very important for the treatment of coronavirus disease and drug development steps. However, distinguishing anti-CoV peptides from other peptides requires much more cost and time consuming in vivo and in vitro. For this reason, it is more advantageous to model and predict in silico environment with machine learning-based studies. In this thesis, it is aimed to digitize protein data with protein coding methods so that anti-CoV peptide sequences, which are therapeutic agents against Covid-19, can be predicted with high accuracy. In this regard, two new protein coding methods named 2gBLO and 2gBLOTVD have been developed. Anti-CoV peptide dataset positive class, antimicrobial (AMP), non-antimicrobial (non-AMP) and non-antiviral (non-AVP) three negative class peptide datasets were used. These protein data were combined with each negative dataset separately to be positive anti-CoV, and datasets with three negative and positive classes were obtained. Data sets were digitized with the developed protein coding methods. The 2gBLO method is obtained by updating the amino acid pair in each coded sequence using the digram method by multiplying the displacement value in the BLOSUM62 matrix. In the 2gBLOTVD method, the number of common physicochemical properties in Taylor's Venn diagram is multiplied by the value obtained from the 2gBLO method. Due to the small sample size in the positive class anti-CoV peptide dataset, unstable datasets were subjected to class balancing in order to increase their performance values. In addition, in order to increase the effect of classification results, discretization method is applied to performance metrics, Naive Bayes, Bayesian Networks, Random Forest, Linear Support Vector Machines (Linear SVM), Radial Support Vector Machines (Radial SVM), k-Nearest Neighborhood (k-NN), Multi-Layer Perceptron (MLA) and Logistic Regression classifier algorithms. According to the experimental results obtained; protein coding methods developed on classifier algorithms give higher performance than hitherto protein coding methods that are prominent.

Benzer Tezler

  1. Sosyal medyada COVID-19 sürecinde aşı ve maske karşıtlığı söylemi: Twitter örneği

    Disclaimer of vaccine and anti-mask in the COVID-19 process in social media: Twitter example

    TUNCAY YILDIZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    İletişim Bilimleriİstanbul Aydın Üniversitesi

    Yeni Medya ve İletişim Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ NUR EMİNE KOÇ

  2. Total kurum kavramı bağlamında koronavirüs aşısına karşıtlık üzerine nitel araştırma

    Qualitative research on anti-coronavirus vaccine within the concept of total institution

    BUSE ŞENOCAK

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    SosyolojiAfyon Kocatepe Üniversitesi

    Sosyoloji Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MEHMET ERKOL

  3. Koronavirüs hastalığı 2019'un atopi ile ilişkisi

    The relationship between coronavirus disease 2019 and atopy

    YÜCEHAN YILMAZ

    Doktora

    Türkçe

    Türkçe

    2024

    Allerji ve İmmünolojiİnönü Üniversitesi

    Fizyoloji Ana Bilim Dalı

    PROF. DR. SEDAT YILDIZ

  4. Covid-19 hastalarında anca (Anti nötrofilik sitoplazmik antikor) parametrelerinin ifa (İmmün floresan antikor) yöntemiyle araştırılması

    Investigation of anca (Anti neutrophiliccytoplasmicantibody) parameters in covid-19 patients by ifa (immune fluorescence antibody) method

    ZEYNEP AYAYDIN

    Doktora

    Türkçe

    Türkçe

    2023

    MikrobiyolojiDicle Üniversitesi

    Tıbbi Mikrobiyoloji Ana Bilim Dalı

    PROF. DR. SELAHATTİN ATMACA

  5. COVİD-19 nedeniyle takip edilen hastalarda serum periostin, matriks metalloproteinaz-7, TGF beta ve IL-18 düzeyinin klinik seyir ve prognozla ilişkisinin araştırılması

    Research of the relationship between serum periostin, matrix metalloproteinase-7, TGF beta and IL-18 level with clinical progress and prognosis in patients followed for COVİD-19

    MEHMET EREN TUNA

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2023

    Göğüs HastalıklarıAtatürk Üniversitesi

    Göğüs Hastalıkları Ana Bilim Dalı

    DOÇ. DR. BUĞRA KERGET