An extension to GOPred to annotate Swiss-Prot and Trembl sequences for all gene ontology categories and EC numbers
Tüm gen ontolojisi ve EC numaraları için Swiss-Prot ve Trembl dizilerini anlamlandırmak amacıyla GOPred yönteminin genişletilmesi
- Tez No: 383223
- Danışmanlar: PROF. DR. MEHMET VOLKAN ATALAY, DOÇ. DR. RENGÜL ATALAY
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2015
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 77
Özet
Sekansı bilinen proteinlerin sayısı üstel olarak arttığı için, geleneksel yöntemlerle yapılan proteinlere fonksiyon tanımlama işlemleri sekansı bilinen proteinlerin fonksiyonlarını belirlemede yetersiz kalmıştır. Bu yüzden, proteinlerin fonksiyon tahmini önemli bir araştırma konusu olarak ortaya çıkmıştır. Bu tezde, protein fonksiyon tahmini GOPred metodu geliştirilerek kullanılmıştır. GOPred metodu sırasıyla altdizi, benzerlik ve özellik tabanlı olan SPMap, Blast-kNN ve Pepstats yöntemlerinden oluşmaktadır. GOPred metodunun önceki versiyonunda 300 moleküler işlev gen ontolojisi terimleri kullanılarak protein fonksiyon sınıflandırılması yapılmıştır. Bu çalışmada, geliştirilen sistem 514 moleküler fonskiyon, 2909 biyolojik süreç ve 438 hücresel bileşen gen ontolojisi terimleri için eğitilmiştir. Sistem ayrıca, enzimlerin 851 Enzim Komisyonu (EC) numarası tahminine uygulanmıştır. Ek olarak, her fonksiyonel terim için optimal karar eşikleri hesabı yeni bir yöntem kullanılarak yapılmıştır. Her fonksiyonel terimin performansı ayrı ayrı hesaplanmış ve fonskiyonel terimlerin ortalama performans değerleri hesaplanarak sistem değerlendirilmiştir. Gen ontolojisi tahmin sonuçları, sistemin performansının çok fonksiyonlu proteinlerde daha iyi olduğunu gösteriyor. Bildiğimiz kadarıyla, sonuçlar enzim komisyonu tahmini konusunda elde edilmiş en iyi sonuçlardır. Geliştirilen sistem; TrEMBL veritabanındaki proteinler için fonksiyon tahmini yapan EMBL, HAMAP, PDB, PIR, PIRNR ve RuleBase referans sistemlerin verdiği tahminlerle bizim sistemimizin verdiği tahminleri karşılaştırmak amacıyla yaklaşık 58 milyon TrEMBL proteini üzerinde test edilmiştir.Sonuçlar sistemimizin verdiği tahminlerinin çoğunun varolan sistemlerin verdiği tahminlerle örtüştüğünü gösteriyor.
Özet (Çeviri)
Traditional protein function annotation methods cannot keep up with annotation of proteins as the number of proteins whose sequences known is increasing exponentially. For this reason, protein function prediction became an important research area. In this thesis, GOPred method is used with improvements for protein function prediction problem. GOPred consists of SPMap, Blast-kNN and Pepstats methods which are subsequence, similarity and feature based methods, respectively. Previous version of GOPred method used for functional classification of proteins based on 300 molecular function Gene Ontology (GO) terms. In this study, improved system is trained for 514 molecular function, 2909 biological process and 438 cellular component GO terms. The system is also applied on functional prediction of enzymes based on 851 Enzyme Commission (EC) Numbers. Hierarchical evaluation of predictions is proposed to give reliable predictions for EC numbers. In addition, we used a new method to calculate optimal decision thresholds for each functional term to determine the predictions that will be given. Optimal thresholds are calculated for each functional term and predictions whose scores are over determined optimal thresholds are presented. Performances of functional terms are measured separately and averages of performances are calculated to evaluate the system. GO term prediction results show that performance of our system is better for prediction of multi-functional proteins. To the best of our knowledge, this is the best performance achieved for EC number prediction in the literature. Improved system is tested on about 58 million TrEMBL proteins to compare predictions that are given by our system with the reference systems that give annotations for TrEMBL database which are EMBL, HAMAP, PDB, PIR, PIRNR and RuleBase. Results show that, most of the predictions that are given by our system are consistent with the predictions that are given by other systems.
Benzer Tezler
- An extension to the variational iteration method for systems and higher-order differential equations
Varyasyonal iterasyon metodunun sistemler ve yüksek dereceli diferensiyel denklemler için genişletilmesi
DERYA ALTINTAN
Doktora
İngilizce
2011
MatematikOrta Doğu Teknik ÜniversitesiBilimsel Hesaplama Ana Bilim Dalı
DOÇ. DR. ÖMÜR UĞUR
- An extensiyon to oasis usernametoken for simplifying username-password authentication
Oasıs kullanıcı adı göstergesinde kullanıcı adı-şifre doğrulamasını kolaylaştırmak için yapılan bir ekleme
HASAN DOĞU
Yüksek Lisans
İngilizce
2005
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi ÜniversitesiDR. AYŞE BENER
- Utilization of timed automata as a verification tool for real-time security protocols
Zamanlı özdevinim kuramının gerçek zamanlı güvenlik protokollerinin doğrulanmasında kullanımı
BURCU KÜLAHÇIOĞLU
Yüksek Lisans
İngilizce
2010
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİzmir Yüksek Teknoloji EnstitüsüBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. AHMET KOLTUKSUZ
PROF. DR. SITKI AYTAÇ
- An Approach to knowledge representation with neural networks using an extended backpropagation learning para digm
Başlık çevirisi yok
WALİD ABU-SALAMEH
Doktora
İngilizce
1991
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiDOÇ.DR. MEHMET R. TOLUN
- AN ADAPTIVE LARGE NEIGHBORHOOD SEARCH APPROACH FOR SOLVING THE ELECTRIC VEHICLE ROUTING PROBLEM WITH TIME WINDOWS
ZAMAN PENCERELİ ELEKTRİKLİ ARAÇ ROTALAMASI PROBLEMİ İÇİN BİR UYARLANABİLİR GENİŞ KOMŞULUK ARAMA YÖNTEMİ
MERVE KESKİN
Yüksek Lisans
İngilizce
2014
Endüstri ve Endüstri MühendisliğiSabancı ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. BÜLENT ÇATAY