Derin öğrenme yöntemi ile protein ikincil yapı tahmini
Protein secondary structure prediction using deep learning method
- Tez No: 688130
- Danışmanlar: DOÇ. DR. İHSAN HAKAN SELVİ
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2021
- Dil: Türkçe
- Üniversite: Sakarya Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilişim Sistemleri Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 73
Özet
Protein yapısı tahmini, biyoinformatik alanındaki çalışmaların merkezi bir odak noktası olmuştur. Son yıllarda, proteinin yapısal bilgisini tahmin etmek için karmaşık makine öğrenmesi ve ardından derin öğrenme yöntemleri gibi birçok istatistiksel yöntem kullanılmıştır. Protein, canlı organizmaların önemli bir parçası olduğundan, protein yapısını ve işlevini anlamak ve değerlendirmek çok önemli hale gelmektedir. Proteinler, amino asit adı verilen yapı taşlarından oluşmaktadır. Protein yapısı büyük ölçüde birincil yapı olarak bilinen amino asit dizileri tarafından belirlenmesine rağmen, protein yapısını tek başına bu dizilerden tahmin etmek zordur. Dolayısıyla, sekanslardan protein ikincil yapı tahmini, proteinin üç boyutlu yapısının tahmini için önemli bir adımdır. Protein ikincil yapı tahmin çalışmalarında birçok yaklaşım kullanılmıştır. Bununla birlikte, günümüze kadar, literatürdeki tekniklerin hiçbiri tam olarak doğru bir sonuç verememiştir, bu da çalışmayı daha zorlu kılmaktadır. Bu tezde, CB513 veri setini kullanarak, derin öğrenme yaklaşımlarından, CNN, RNN, LSTM ve GRU kullanımına ilişkin karşılaştırmalı bir çalışma sağlanmaya çalışılmıştır. Çalışmada ayrıca her bir yaklaşımın performansı analiz edilmiş ve literatürdeki benzer çalışmalarla karşılaştırılmıştır. Bu çalışmada protein ikincil yapının tahmini için geliştirilen CNN, RNN, LSTM ve GRU modelleri sırasıyla %82,54, %81,06, %81,10, %81,48 başarı oranı elde etmiştir.
Özet (Çeviri)
Protein structure prediction has been a central focus of study in Bioinformatics. In the past few decades, many statistical methods, such as complex machine learning, followed by deep learning methods have been applied to estimate structural information of protein. Since protein is a significant part of living-organisms, understanding and assessing protein and its functions becomes crucial. Proteins are made by building block, called amino acid. Although protein structure is largely determined by amino acid sequences, known as primary structure, it is difficult to predict protein structure from those sequences alone. Thus, protein secondary structure prediction from the sequences is an important step for the estimation of protein three- dimensional structure. Many approaches have been employed onto protein secondary structure prediction studies. However, up to present days, none of the available techniques in literature is able to provide a fully accurate result, which makes the study more challenging. By using CB513 dataset, this thesis attempts to provide a comparative study of the use of deep learning approaches, CNN, RNN, LSTM and GRU. In the study, the performance of each approach was analyzed and compared with the similar studies in literature. The models, CNN, RNN, LSTM and GRU, developed for protein secondary structure prediction in this study achieved %82,54, %81,06, %81,10, %81,48 accuracy.
Benzer Tezler
- Prediction of protein-protein interaction sites using an ensemble learning method
Topluluk öğrenme yöntemi kullanılarak protein-protein etkileşim bölgelerinin tahmini
ENGİN AYBEY
Doktora
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEge ÜniversitesiSağlık Biyoinformatiği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ÖZGÜR GÜMÜŞ
- Scoring of CERbB2 tumors in breast cancer by pathological image analysis
Patolojik görüntü analizi ile meme kanserinde CERbB2 tümörlerinin skor değerlerinin belirlenmesi
GÖZDE AYŞE TATAROĞLU
Yüksek Lisans
İngilizce
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Bilimleri Ana Bilim Dalı
DOÇ. DR. BEHÇET UĞUR TÖREYİN
- Mathematical model-based clinical decision support system algorithm design study that can support the diagnosis of celiac disease
Çölyak hastalığının teşhisine destek verebilecek matematik model tabanlı kds algoritması tasarımı
ELİF KESKİN BİLGİÇ
Doktora
İngilizce
2024
Mühendislik Bilimleriİstanbul Üniversitesi-CerrahpaşaBiyomedikal Mühendisliği Ana Bilim Dalı
DR. İNCİ ZAİM GÖKBAY
DOÇ. DR. YUSUF KAYAR
- Makine öğrenmesi yöntemleri kullanarak kanser teşhisi
Cancer prediction using machine learning methods
SİYABEND TURGUT
Yüksek Lisans
Türkçe
2017
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. MUSTAFA DAĞTEKİN
YRD. DOÇ. DR. TOLGA ENSARİ
- Deep learning for prediction of drug-target interaction space and protein functions
İlaç-hedef protein etkileşim uzayı ve protein fonksiyonlarının tahmini için derin öğrenme
AHMET SÜREYYA RİFAİOĞLU
Doktora
İngilizce
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. MEHMET VOLKAN ATALAY
PROF. DR. RENGÜL ÇETİN ATALAY