Evaluation of protein secondary structure prediction algorithms on a new advanced benchmark dataset
Protein ikincil yapı tahmini algoritmalarının yeni ve ileri kıyaslamalı veritabanında değerlendirilmeleri
- Tez No: 302384
- Danışmanlar: DOÇ. DR. JENS ALLMER
- Tez Türü: Yüksek Lisans
- Konular: Genetik, Moleküler Tıp, Genetics, Molecular Medicine
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2011
- Dil: İngilizce
- Üniversite: İzmir Yüksek Teknoloji Enstitüsü
- Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Moleküler Biyoloji ve Genetik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 54
Özet
1970'lerden bu yana araştırmacılar protein ikincil yapı tahmini çalışmaktadırlar. Fakat günümüzdeki metotların kesinliği yaklaşık olarak %80-85' e ulaşmaktadır. Bunun sebeplerinden biri algoritmanın eğitimi ve testinde kullanılan veri setlerinden kaynaklı kısıtlamalardır. N sayıdaki deneysel olarak tanımlanmış proteini ve aynı zamanda proteinlerin fonksiyonlarına, biyokimyasal özelliklerine ve lokasyon anotasyonlarına dair bilgileri içeren veri setleri bize algoritmalarının belli protein grupları üzerinde nasıl çalıştıklarını direk gösterecektir. Bu ayrıca kullanıcılara veri setlerinde algoritmalarının kalitelerini belirleme ve hangi algoritmanın hangi tip protein grubu üzerinde kullanılabileceğine karar verme konusunda olanak tanıyacaktır.Bu tez çalışmasında, çalışma amacı deneysel olarak tanımlanmış ProteinVeriBankası (PDB) `den elde edilmiş S2C veritabanında yer alan 64872 proteinin fonksiyonel ve biyokimyasal bilgilerini içeren yeni ve ileri protein veritabanı geliştirilmesi olarak belirlenmiştir. Bu veritabanı ile 7 ulaşılabilir tahmin algoritmasının performansları proteinlerin fonksiyonları ve lokalizasyonları bakımından farklı standart veri setleri üzerinde değerlendirilmiştir. Önerilen standart verisetlerinden elde edilen sonuçların var olan RS126 verisetinde elde edilmiş sonuçlarıyla kıyasına göre, proteinleri hücresel lokalizasyonlarındaki fonksiyonlarına göre gruplamanın var olan algoritmaların objektif değerlendirilmesinde büyük etkisi olduğu gösterilmiştir.
Özet (Çeviri)
Starting from 1970s, researchers have been studying secondary structure prediction. However the accuracy of state-of art methods reach to approximately 80-85%. One of the reasons for that is related with the limitations in respect to datasets used for training or testing the algorithm. A number of databases with n number of experimentally determined proteins, which also contain the knowledge of functionality, biochemical properties and location annotation of proteins, will directly show us how the algorithms work on certain groups of proteins. This also ensures opportunity to users to determine the quality of algorithms on those datasets and to decide on which algorithm can be used for which type of proteins.In this thesis, the objective is set through the development of a new and advanced protein benchmark database which contains functional and biochemical information of experimentally defined 64872 proteins in S2C database derived by ProteinDataBank (PDB). With this database, the seven available predictors are evaluated in respect to their performances on different datasets in terms of functionality and subcellular localization of proteins in the benchmark database. According to the results obtained on proposed benchmark datasets in compare to results on one of existing dataset, RS126, it was shown that grouping proteins into functions in their subcellular localizations have a great impact on deciding the accuracies of existing algorithms.
Benzer Tezler
- COVID-19 mutasyonlarının tespitinde yapay zeka tabanlı algoritmaların kullanılması
Use of artificial intelligence-based algorithms in detecting COVID-19 mutations
MEHMET BURUKANLI
Doktora
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. NEJAT YUMUŞAK
- Protein fold classification and motif retrieval methods by using the primary and secondary structures
Primer ve sekonder yapılar kullanılarak proteinlerin fold düzeyinde sınıflandırılması ve motif çıkarımı
ÖZLEM POLAT
Doktora
İngilizce
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. ZÜMRAY DOKUR ÖLMEZ
- Metabolism-oriented multiomics data integration
Farklı omı̇k verı̇lerı̇n metabolı̇zma odaklı entegrasyonu
AYCAN ŞAHİN
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. ALİ ÇAKMAK
- Alt sekans profil haritaları kullanılarak protein katlanması tanıma
Protein fold recognition using subsequence profile maps
RUŞEN HALEPMOLLASI
Yüksek Lisans
Türkçe
2016
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. ÖMER SİNAN SARAÇ
- Determination of physicochemical properties and hydrogelling ability of avocado seed proteins dried with different methods
Farklı yöntemlerle kurutulmuş avokado çekirdeği proteinlerinin fizikokimyasal özelliklerinin ve hidrojel oluşturma yeteneğinin belirlenmesi
BAKHTIYAR AZAD ABDULLAH ABDULLAH
Doktora
İngilizce
2024
Gıda MühendisliğiHarran ÜniversitesiGıda Mühendisliği Ana Bilim Dalı
PROF. DR. MEHMET KARAASLAN