Dimensionality reduction for protein secondary structure prediction
Protein ikincil yapı tahmini için boyut küçültme
- Tez No: 476273
- Danışmanlar: YRD. DOÇ. DR. ZAFER AYDIN, DOÇ. DR. OĞUZ KAYNAR
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Biyomühendislik, Computer Engineering and Computer Science and Control, Bioengineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2017
- Dil: İngilizce
- Üniversite: Abdullah Gül Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 68
Özet
Gerekli metabolik süreçleri yürüten proteinler insan hayatı için büyük önem taşımaktadır. Proteinlerin fonksiyonları ile üç boyutlu yapıları arasında yakın bir ilişki bulunmaktadır. Dört yapı düzeyi olan proteinlerin bir çoğunun, birincil yapı olarak da adlandırılan amino asit dizilimi bilinmekte ancak üçüncül yapıları bilinmemektedir. Üçüncül yapıların laboratuvar ortamında tespit edilmesinin çok maliyetli ve zor olması, amino asit dizilimini kullanarak yapı tahmini yapan sistemlerin geliştirilmesine neden olmuştur. Protein yapı tahmini yapan sistemlerin en önemli aşamalarından biri ise ikincil yapı etiketlerinin tanımlanması işlemidir. Yeni öznitelik çıkarma yaklaşımları geliştirildikçe yapısal özelliklerin tahmini için kullanılan veri setleri yüksek boyutlara sahip olabilmekte ve kullanılan özniteliklerden bazıları gürültülü veri içerebilmektedir. Bu nedenle uygun sayıda ve doğru öznitelikleri seçmek, iyi bir başarı oranı elde etmek için önemli aşamalardan biridir. Bu çalışmada iki farklı veri seti üzerinde derin oto kodlayıcı kullanılarak boyut düşürme işlemi uygulanmış, temel bileşen analizi, ki-kare, bilgi kazancı, kazanım oranı, korelasyon tabanlı öznitelik seçim teknikleri ve minimum fazlalık maksimum ilgi algoritması gibi çeşitli öznitelik seçim ve boyut düşürme teknikleri ayrıca genetik algoritma, aç gözlü algoritma ve en iyi ilk önce algoritması gibi çeşitli arama stratejileri ile birlikte kullanılarak elde edilen veri setleri ile karşılaştırılmıştır. İkincil yapı tahmin başarısının karşılaştırılması için destek vektör makinası kullanılmıştır.
Özet (Çeviri)
Proteins are important for our lives and they execute essential metabolic processes. The functions of the proteins can be understood by looking at the three-dimensional structures of the proteins. Because the experimental detection of tertiary structure is costly computational systems that estimate the structure provides a convenient alternative. One of the important steps of protein structure estimation is the identification of secondary structure tags. As new feature extraction methods are developed, the data sets used for this estimation can have high dimensions and some of the attributes can contain noisy data. For this reason, choosing the right number of features and the right attributes is one of the important steps to achieve a good success rate. In this study, size reduction process is applied on two different datasets using a deep autoencoder and various dimension reduction and feature selection techniques such as basic component analysis, chi-square, information gain, gain ratio, correlationbased feature selection (CFS) and the minimum redundancy maximum relevance algorithm as well as search strategies such as best first, genetic search, greedy algorithm. To evaluate the prediction accuracy, a support vector machine classifier is employed.
Benzer Tezler
- Perturbation-response and noise dynamics in proteins and representation learning for biomolecular simulations
Proteinlerde pertürbasyon-tepki ve gürültü dinamiği ve biyomoleküler simülasyonlarda temsil öğrenme
YASEMİN BOZKURT VAROLGÜNEŞ
Doktora
İngilizce
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKoç ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. ALPER DEMİR
- Kütle spektrometresi verilerinin analiziyle prostat ve yumurtalık kanserlerinin belirlenmesi
Prostate and ovarian cancer identification by analyzing mass spectrometry data
VEDAT TAŞKIN
Yüksek Lisans
Türkçe
2013
Biyoistatistikİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. TAMER ÖLMEZ
- Classification of proteins using sequential and structural features
Proteinlerin dizisel ve yapısal özelliklerinin kullanılarak sınıflandırılması
AYDIN ALBAYRAK
Doktora
İngilizce
2011
BiyoistatistikSabancı ÜniversitesiBiyoloji Bilimleri ve Biyomühendislik Ana Bilim Dalı
DOÇ. DR. UĞUR SEZERMAN
- Exploratory visualization of biological networks
Biyolojik ağların keşifsel görselleştirilmesi
MERVE SU GÖÇMEN
Yüksek Lisans
İngilizce
2023
Bilim ve TeknolojiKoç ÜniversitesiBiyomedikal Bilimler ve Mühendislik Ana Bilim Dalı
PROF. MEHMET GÖNEN
- Hyperparameter optimization of autoencoders for deeplearning of collective variables
Kollektif değişkenlerin derin öğrenmesi için otokodlayıcıların hiperparametreoptimizasyonu
NURDAN ÖZKARAASLAN
Yüksek Lisans
İngilizce
2024
Kimya MühendisliğiBoğaziçi ÜniversitesiBilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
DOÇ. DR. BETÜL URALCAN KILAVUZ