Geri Dön

Dimensionality reduction for protein secondary structure prediction

Protein ikincil yapı tahmini için boyut küçültme

  1. Tez No: 476273
  2. Yazar: YASİN GÖRMEZ
  3. Danışmanlar: YRD. DOÇ. DR. ZAFER AYDIN, DOÇ. DR. OĞUZ KAYNAR
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Biyomühendislik, Computer Engineering and Computer Science and Control, Bioengineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2017
  8. Dil: İngilizce
  9. Üniversite: Abdullah Gül Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 68

Özet

Gerekli metabolik süreçleri yürüten proteinler insan hayatı için büyük önem taşımaktadır. Proteinlerin fonksiyonları ile üç boyutlu yapıları arasında yakın bir ilişki bulunmaktadır. Dört yapı düzeyi olan proteinlerin bir çoğunun, birincil yapı olarak da adlandırılan amino asit dizilimi bilinmekte ancak üçüncül yapıları bilinmemektedir. Üçüncül yapıların laboratuvar ortamında tespit edilmesinin çok maliyetli ve zor olması, amino asit dizilimini kullanarak yapı tahmini yapan sistemlerin geliştirilmesine neden olmuştur. Protein yapı tahmini yapan sistemlerin en önemli aşamalarından biri ise ikincil yapı etiketlerinin tanımlanması işlemidir. Yeni öznitelik çıkarma yaklaşımları geliştirildikçe yapısal özelliklerin tahmini için kullanılan veri setleri yüksek boyutlara sahip olabilmekte ve kullanılan özniteliklerden bazıları gürültülü veri içerebilmektedir. Bu nedenle uygun sayıda ve doğru öznitelikleri seçmek, iyi bir başarı oranı elde etmek için önemli aşamalardan biridir. Bu çalışmada iki farklı veri seti üzerinde derin oto kodlayıcı kullanılarak boyut düşürme işlemi uygulanmış, temel bileşen analizi, ki-kare, bilgi kazancı, kazanım oranı, korelasyon tabanlı öznitelik seçim teknikleri ve minimum fazlalık maksimum ilgi algoritması gibi çeşitli öznitelik seçim ve boyut düşürme teknikleri ayrıca genetik algoritma, aç gözlü algoritma ve en iyi ilk önce algoritması gibi çeşitli arama stratejileri ile birlikte kullanılarak elde edilen veri setleri ile karşılaştırılmıştır. İkincil yapı tahmin başarısının karşılaştırılması için destek vektör makinası kullanılmıştır.

Özet (Çeviri)

Proteins are important for our lives and they execute essential metabolic processes. The functions of the proteins can be understood by looking at the three-dimensional structures of the proteins. Because the experimental detection of tertiary structure is costly computational systems that estimate the structure provides a convenient alternative. One of the important steps of protein structure estimation is the identification of secondary structure tags. As new feature extraction methods are developed, the data sets used for this estimation can have high dimensions and some of the attributes can contain noisy data. For this reason, choosing the right number of features and the right attributes is one of the important steps to achieve a good success rate. In this study, size reduction process is applied on two different datasets using a deep autoencoder and various dimension reduction and feature selection techniques such as basic component analysis, chi-square, information gain, gain ratio, correlationbased feature selection (CFS) and the minimum redundancy maximum relevance algorithm as well as search strategies such as best first, genetic search, greedy algorithm. To evaluate the prediction accuracy, a support vector machine classifier is employed.

Benzer Tezler

  1. Perturbation-response and noise dynamics in proteins and representation learning for biomolecular simulations

    Proteinlerde pertürbasyon-tepki ve gürültü dinamiği ve biyomoleküler simülasyonlarda temsil öğrenme

    YASEMİN BOZKURT VAROLGÜNEŞ

    Doktora

    İngilizce

    İngilizce

    2020

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKoç Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. ALPER DEMİR

  2. Kütle spektrometresi verilerinin analiziyle prostat ve yumurtalık kanserlerinin belirlenmesi

    Prostate and ovarian cancer identification by analyzing mass spectrometry data

    VEDAT TAŞKIN

    Yüksek Lisans

    Türkçe

    Türkçe

    2013

    Biyoistatistikİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    PROF. DR. TAMER ÖLMEZ

  3. Classification of proteins using sequential and structural features

    Proteinlerin dizisel ve yapısal özelliklerinin kullanılarak sınıflandırılması

    AYDIN ALBAYRAK

    Doktora

    İngilizce

    İngilizce

    2011

    BiyoistatistikSabancı Üniversitesi

    Biyoloji Bilimleri ve Biyomühendislik Ana Bilim Dalı

    DOÇ. DR. UĞUR SEZERMAN

  4. Exploratory visualization of biological networks

    Biyolojik ağların keşifsel görselleştirilmesi

    MERVE SU GÖÇMEN

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilim ve TeknolojiKoç Üniversitesi

    Biyomedikal Bilimler ve Mühendislik Ana Bilim Dalı

    PROF. MEHMET GÖNEN

  5. Hyperparameter optimization of autoencoders for deeplearning of collective variables

    Kollektif değişkenlerin derin öğrenmesi için otokodlayıcıların hiperparametreoptimizasyonu

    NURDAN ÖZKARAASLAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Kimya MühendisliğiBoğaziçi Üniversitesi

    Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı

    DOÇ. DR. BETÜL URALCAN KILAVUZ