Alignment and compression-based protein function prediction using secondary structure
Hizalama ve sıkıştırma tabanlı protein fonksiyon öngörüsünde ikincil yapının katkısı
- Tez No: 387982
- Danışmanlar: DOÇ. DR. ZEHRA ÇATALTEPE
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2008
- Dil: İngilizce
- Üniversite: İstanbul Teknik Üniversitesi
- Enstitü: Bilişim Enstitüsü
- Ana Bilim Dalı: İleri Teknolojiler Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 78
Özet
Protein fonksiyon öngörüsü, biyoinformatikteki en önemli ve zor problemlerden biridir. Amino asit dizisine ek olarak öngörülmüş veya gerçek ikincil yapı, protein fonksiyon öngörüsü için sıklıkla kullanılmıştır. Fonksiyon öngörüsü için genellikle amino asit ve ikincil yapı dizileri kullanılarak hesaplanan hizalama puanları kullanılır. En çok kullanılan hizalama algoritmalarından biri, uzak proteinlerin benzerliklerini saptamak için çok uygun bir yerel hizalama algoritması olan Smith-Waterman hizalamasıdır. Normalize sıkıştırma uzaklığı (NCD), proteinlerde olduğu kadar müzik, metin, resim, istenmeyen e-posta filtreleme ve hatta fizik gibi alanlarda da kullanılabilen bir diğer uzaklık ölçütüdür. Smith-Waterman hizalama puanları ve NCD fonksiyon öngörüsünde kullanılmış ve NCD'nin tek başına hizalamadan daha kötü performans gösterdiğini, ancak NCD ve hizalama puanlarının birleşiminin her iki ölçütten de daha başarılı olduğu gösterilmiştir. Bu çalışmada, her ikisi de amino asit dizisine ek olarak ikincil yapıyı da içeren Smith-Waterman ve NCD ölçütlerinin birleşiminden yeni bir ölçüt elde edilerek fonksiyon öngörüsünde ikincil yapıdan da faydalanılmıştır. Deneyler sonucunda, ikincil yapının katkısının hem Smith-Waterman hem de NCD ile yapılan öngörülerde iyileşme sağladığı görülmüştür. Birleştirilmiş ölçüt ile yapılan sınıflandırmanın performansı yalnızca NCD puanları ile yapılan sınıflandırmadan daha başarılı olurken, yalnızca Smith-Waterman puanları ile yapılan sınıflandırma her ikisinden daha başarılı olmuştur. Smith-Waterman hizalama puanları ile yapılan sınıflandırma aynı zamanda, hem bir amino asit için hem birincil hem de ikincil yapıyı belirten bileşik bir gösterim üzerinden hesaplanan NCD puanları ile yapılan sınıflandırmadan, hem de bütün Smith-Waterman ve NCD puanlarını içeren nitelik vektörleri ile yapılan sınıflandırmadan daha başarılı sonuç vermiştir.
Özet (Çeviri)
Protein function prediction is one of the most important and difficult problems in bioinformatics. Predicted or actual protein secondary structure, in addition to amino acid sequence, is often used for function prediction. Usually, alignment scores between amino acid or secondary structure sequences are used to predict protein function. One of the most frequently used alignment algorithms is the Smith-Waterman alignment which is a local alignment algorithm suitable for detecting remote protein similarities. The normalized compression distance (NCD) is another measure of distance that can be used between protein sequences as well as other kinds of data, such as music, text, images, spam filtering, even physics. Smith-Waterman alignment scores and NCD have already been used for function prediction and it has been shown that NCD performs worse than alignment, while combination of NCD and alignment scores outperforms alignment scores only. In this study, the secondary structure is involved in protein function prediction by using a combined similarity metric that includes both Smith-Waterman alignment and normalized compression distance scores that consider the secondary structure in addition to the amino acid sequence. The study shows that using the combined similarity metric outperforms the performance of NCD scores, however using Smith-Waterman scores only outperforms both. It also outperforms the classification made using a notation that jointly represents the amino acid and secondary structure sequences, as well as classification using feature vectors made up from all Smith-Waterman and NCD scores.
Benzer Tezler
- Özel bir piston ve kilit mekanizmasına sahip yüksek başlangıç ivmeli göğüs kompresyon cihazının tasarımı, simülasyonu ve üretimi
Design, simulation, and fabrication of a high initial acceleration automatic chest compression device with a special piston and locking mechanism
AHMET KAĞIZMAN
Doktora
Türkçe
2024
Biyomühendislikİstanbul Teknik ÜniversitesiMekatronik Mühendisliği Ana Bilim Dalı
PROF. DR. VOLKAN SEZER
- Fiber orientation prediction for 3D injection and compression molded parts
Enjeksiyon ve sıkıştırmalı kalıp parçaları için üç boyutlu tahmini lif yönlendirmesi
İDRİS KAYNAK
Doktora
İngilizce
2005
Makine MühendisliğiDokuz Eylül ÜniversitesiMakine Mühendisliği Ana Bilim Dalı
PROF. DR. ONUR SAYMAN
- Plastik kalıp tasarım esasları ve uygulamalı kalıp tasarım örneği
Principle of plastic injection mold design and a sample of applied mold design
CANKUT BUCAKLIGİL
Yüksek Lisans
Türkçe
1999
Makine Mühendisliğiİstanbul Teknik ÜniversitesiMakine Mühendisliği Ana Bilim Dalı
PROF. DR. TEOMAN KURTAY
- Konsolidasyon süresince kil yapısındaki değişimin araştırılması
Research of the change in the clay structures during consolidation
BİRKAN YÜKSEL
Yüksek Lisans
Türkçe
2007
İnşaat Mühendisliğiİstanbul Üniversitesiİnşaat Mühendisliği Ana Bilim Dalı
PROF.DR. S. FEYZA ÇİNİCİOĞLU
- Yüksek tibial osteomide lateral korteks kırığının klinik ve radyolojik sonuçlara etkisi
Effect of lateral cortex fracture on clinical and radiological outcomes in high tibial osteomy
SERCAN BAHADIR
Tıpta Uzmanlık
Türkçe
2024
Ortopedi ve TravmatolojiSağlık Bilimleri ÜniversitesiOrtopedi ve Travmatoloji Ana Bilim Dalı
DOÇ. DR. MEHMET ÖZBEY BÜYÜKKUŞCU