Geri Dön

Protein secondary structure prediction with classifier fusion

Sınıflandırıcı birleştirimi ile protein ikincil yapısı kestirimi

  1. Tez No: 215851
  2. Yazar: İSA KEMAL PAKATCI
  3. Danışmanlar: YRD. DOÇ. DR. HAKAN ERDOĞAN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Biyoistatistik, Biostatistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2008
  8. Dil: İngilizce
  9. Üniversite: Sabancı Üniversitesi
  10. Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Biyoistatistik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 78

Özet

Bilinen protein dizileri sayısı çok hızlı artmaktadır, fakat proteinlerin yapısını deneysel metotlarla belirlemek maliyetli ve yavaş olduğu için yapısı bilinen proteinlerin sayısı ile dizisi bilinen proteinlerin sayısı arasındaki fark gittikçe artmaktadır. Bu yüzden amino asit zinciri bilinen bir proteinin yapısının hesaplamalı yollarla bulunması bu farkı kapatmak açısından önemlidir. Bu tezde ikincil yapı adı verilen protein yapısının kestirimi üzerine yoğunlaşılmıştır. İkincil yapı kestirimi kategoriler halinde incelenebilir. Bazı diziler çoklu dizi profilleri ile zenginleştirilebilirken bazı diziler için profil çıkartılamaz. Bu iki durum da bu çalışmada incelenmiştir.Yoğunlaştığımız ilk durum çoklu dizi hizalama bilgisinin olmadığı durumdur. Boyut düşürme ve öznitelik seçimi yöntemleri kullanılarak tekli, çiftli ve pozisyon özniteliklerini profil bilgisinden çıkaran yeni bir öznitelik çıkarma yöntemi geliştirdik. Çıkarılan bu öznitelikler ile ham öznitelikleri sınıflandırma için kullandık. Kullandığımız ilk seviye sınıflandırıcılar saklı Markov modeli, destek vektör makinesi, doğrusal ayırtaç sınıflandırıcısıdır. Bu ilk seviye sınıflandırıcıları birleştiren yeni bir yöntem sunulmuştur.İkinci olarak, tek dizi protein ikincil yapısı kestirimi problemine yoğunlaştık. Bu problem için daha önceden önerilmiş olan IPSSP algorithmasının performansını arttırmak için değişik eğitim kümesi indirgeme yöntemleri incelenmiştir. Deney sonuçları eğitim kümesi indirgemenin, yetim proteinlerin ikincil yapısının kestirimi için işe yaradığını göstermektedir.

Özet (Çeviri)

The number of known protein sequences is increasing very rapidly. However, experimentally determining protein structure is costly and slow, so the number of proteins with known sequence but unknown structure is increasing. Thus, computational methods for prediction of structure of a protein from its amino acid sequence are very useful. In this thesis, we focus on the problem of a special type of protein structure prediction called secondary structure prediction. The problem of structure prediction can be analyzed in categories. Some sequences can be enriched by forming multiple alignment profiles, whereas some are single sequences where one cannot form profiles. We look into different aspects of both cases in this thesis.The first case we focus in this thesis is when multiple sequence alignment information exists. We introduce a novel feature extraction technique that extracts unigram, bigram and positional features from profiles using dimension reduction and feature selection techniques. We use both these novel features and regular raw features for classification. We experimented with the following types of first level classifiers: Linear Discriminant Classifier (LDCs), Support Vector Machines (SVMs) and Hidden Markov Models (HMMs). A novel method that combines these classifiers is introduced.Secondly, we focus on protein secondary structure prediction of single sequences. We explored different methods of training set reduction in order to increase the prediction accuracy of the IPSSP (Iterative Protein Secondary Structure Prediction) algorithm that was introduced before [ipssp]. Results show that composition-based training set reduction is useful in prediction of secondary structures of orphan proteins.

Benzer Tezler

  1. Kümelenmiş protein dizileri kullanarak yapısal özellik tahmini yapan yöntemlere özellik vektörü tasarlamak

    Designing feature vector for methods which predict protein structure by using clustered protein sequences

    SEMA ATASEVER

    Doktora

    Türkçe

    Türkçe

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKırıkkale Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. HASAN ERBAY

    DR. ÖĞR. ÜYESİ ZAFER AYDIN

  2. Protein işlev kestiriminde yapısal bilginin katkısı ve dizi geçiş olasılıkları ile peptit sınıflandırma

    Improvement of protein function prediction using structural information and peptide classification using syntactic transition probabilities

    ESER AYGÜN

    Yüksek Lisans

    Türkçe

    Türkçe

    2009

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ZEHRA ÇATALTEPE

  3. Alt sekans profil haritaları kullanılarak protein katlanması tanıma

    Protein fold recognition using subsequence profile maps

    RUŞEN HALEPMOLLASI

    Yüksek Lisans

    Türkçe

    Türkçe

    2016

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. ÖMER SİNAN SARAÇ

  4. Protein fold classification and motif retrieval methods by using the primary and secondary structures

    Primer ve sekonder yapılar kullanılarak proteinlerin fold düzeyinde sınıflandırılması ve motif çıkarımı

    ÖZLEM POLAT

    Doktora

    İngilizce

    İngilizce

    2015

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    PROF. DR. ZÜMRAY DOKUR ÖLMEZ

  5. Protein fragment selection using machine learning

    Makine öğrenmesi ile protein parçacık seçimi

    ALPEREN EMRE ULUTAŞ

    Yüksek Lisans

    İngilizce

    İngilizce

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAbdullah Gül Üniversitesi

    Elektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ZAFER AYDIN