Geri Dön

Derin öğrenme yöntemi ile protein ikincil yapı tahmini

Protein secondary structure prediction using deep learning method

  1. Tez No: 688130
  2. Yazar: EZGİ ÇAKMAK
  3. Danışmanlar: DOÇ. DR. İHSAN HAKAN SELVİ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2021
  8. Dil: Türkçe
  9. Üniversite: Sakarya Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilişim Sistemleri Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 73

Özet

Protein yapısı tahmini, biyoinformatik alanındaki çalışmaların merkezi bir odak noktası olmuştur. Son yıllarda, proteinin yapısal bilgisini tahmin etmek için karmaşık makine öğrenmesi ve ardından derin öğrenme yöntemleri gibi birçok istatistiksel yöntem kullanılmıştır. Protein, canlı organizmaların önemli bir parçası olduğundan, protein yapısını ve işlevini anlamak ve değerlendirmek çok önemli hale gelmektedir. Proteinler, amino asit adı verilen yapı taşlarından oluşmaktadır. Protein yapısı büyük ölçüde birincil yapı olarak bilinen amino asit dizileri tarafından belirlenmesine rağmen, protein yapısını tek başına bu dizilerden tahmin etmek zordur. Dolayısıyla, sekanslardan protein ikincil yapı tahmini, proteinin üç boyutlu yapısının tahmini için önemli bir adımdır. Protein ikincil yapı tahmin çalışmalarında birçok yaklaşım kullanılmıştır. Bununla birlikte, günümüze kadar, literatürdeki tekniklerin hiçbiri tam olarak doğru bir sonuç verememiştir, bu da çalışmayı daha zorlu kılmaktadır. Bu tezde, CB513 veri setini kullanarak, derin öğrenme yaklaşımlarından, CNN, RNN, LSTM ve GRU kullanımına ilişkin karşılaştırmalı bir çalışma sağlanmaya çalışılmıştır. Çalışmada ayrıca her bir yaklaşımın performansı analiz edilmiş ve literatürdeki benzer çalışmalarla karşılaştırılmıştır. Bu çalışmada protein ikincil yapının tahmini için geliştirilen CNN, RNN, LSTM ve GRU modelleri sırasıyla %82,54, %81,06, %81,10, %81,48 başarı oranı elde etmiştir.

Özet (Çeviri)

Protein structure prediction has been a central focus of study in Bioinformatics. In the past few decades, many statistical methods, such as complex machine learning, followed by deep learning methods have been applied to estimate structural information of protein. Since protein is a significant part of living-organisms, understanding and assessing protein and its functions becomes crucial. Proteins are made by building block, called amino acid. Although protein structure is largely determined by amino acid sequences, known as primary structure, it is difficult to predict protein structure from those sequences alone. Thus, protein secondary structure prediction from the sequences is an important step for the estimation of protein three- dimensional structure. Many approaches have been employed onto protein secondary structure prediction studies. However, up to present days, none of the available techniques in literature is able to provide a fully accurate result, which makes the study more challenging. By using CB513 dataset, this thesis attempts to provide a comparative study of the use of deep learning approaches, CNN, RNN, LSTM and GRU. In the study, the performance of each approach was analyzed and compared with the similar studies in literature. The models, CNN, RNN, LSTM and GRU, developed for protein secondary structure prediction in this study achieved %82,54, %81,06, %81,10, %81,48 accuracy.

Benzer Tezler

  1. Prediction of protein-protein interaction sites using an ensemble learning method

    Topluluk öğrenme yöntemi kullanılarak protein-protein etkileşim bölgelerinin tahmini

    ENGİN AYBEY

    Doktora

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEge Üniversitesi

    Sağlık Biyoinformatiği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ÖZGÜR GÜMÜŞ

  2. Scoring of CERbB2 tumors in breast cancer by pathological image analysis

    Patolojik görüntü analizi ile meme kanserinde CERbB2 tümörlerinin skor değerlerinin belirlenmesi

    GÖZDE AYŞE TATAROĞLU

    Yüksek Lisans

    İngilizce

    İngilizce

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Bilimleri Ana Bilim Dalı

    DOÇ. DR. BEHÇET UĞUR TÖREYİN

  3. Mathematical model-based clinical decision support system algorithm design study that can support the diagnosis of celiac disease

    Çölyak hastalığının teşhisine destek verebilecek matematik model tabanlı kds algoritması tasarımı

    ELİF KESKİN BİLGİÇ

    Doktora

    İngilizce

    İngilizce

    2024

    Mühendislik Bilimleriİstanbul Üniversitesi-Cerrahpaşa

    Biyomedikal Mühendisliği Ana Bilim Dalı

    DR. İNCİ ZAİM GÖKBAY

    DOÇ. DR. YUSUF KAYAR

  4. Makine öğrenmesi yöntemleri kullanarak kanser teşhisi

    Cancer prediction using machine learning methods

    SİYABEND TURGUT

    Yüksek Lisans

    Türkçe

    Türkçe

    2017

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. MUSTAFA DAĞTEKİN

    YRD. DOÇ. DR. TOLGA ENSARİ

  5. Deep learning for prediction of drug-target interaction space and protein functions

    İlaç-hedef protein etkileşim uzayı ve protein fonksiyonlarının tahmini için derin öğrenme

    AHMET SÜREYYA RİFAİOĞLU

    Doktora

    İngilizce

    İngilizce

    2020

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. MEHMET VOLKAN ATALAY

    PROF. DR. RENGÜL ÇETİN ATALAY