Geri Dön

A clustering method for the problem of protein subcellular localization

Proteinlerin hücre içi yerleşimlerini bulmak için bir kümeleme yöntemi

  1. Tez No: 199348
  2. Yazar: PERİT BEZEK
  3. Danışmanlar: PROF. DR. VOLKAN ATALAY
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Protein Sınıflandırma, Hücre Işi Yerleşim, Tayfsal Obekleme, u sgüuMetin Düzeneleme Uzaklığı, Ortük Motifleru, Protein Classification, Subcellular Localization, Spectral Clustering, StringEdit Distance, Implicit Motifs
  7. Yıl: 2006
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 85

Özet

Perit BezekBu calışmanın odak noktası proteinlerin hücre işi yerleşimlerini bulmaktır cunküşs u c s şü uhücre işi yerleşim bir proteinin işlevlerini anlamada gayet yardımcı olacak bilgileru c s sişerir. Bir proteinin işlevleri amino asit dizisinden kestirilebilir. Motifler ya da ko-c srunan altdiziler güclü bir şekilde belirli bir işlevin varlığına işaret eder. Aynı işleveuş u s s g s ssahip olduğu bilinen bir grup protein dizisinde, belirli bir altdizi ya da belirili birgaltdizi grubu sıkşa rastlanır olmalıdır yani bu altdizi gruplarının gürülme sıklığı,c ou gfrekansı, yüksek olmalıdır.uBizim fikrimiz bu ortak altdizileri übekleme yüntemi ile bulmak ve onları (implicito o˙motifs) proteinleri sınıflandırmak işin kullanmaktır. Iki altdizi arasındaki mesafeyichesaplamak işin geleneksel metin düzenleme uzaklığı, sadece harflerin değiştirilmesinec u g gsizin verecek şekilde uyarlanmış ve değişirme masrafı da bir amino asit benzerlik ma-s s gstrisine bağlı olacak hale getirilmiştir. Tayfsal übekleme, bu yeni metin düzenlemeg s o uuzaklığını baz alarak altdizileri başka bir uzaya gündermektedir; büylece kümelemeg s o o uproblemi daha kolay cüzülür hale gelmektedir. Verilen bir protein dizisi işin alt-şo u u cdizilerinin übeklere güre dağılımı bir sınıflandırıcıya verilecek olan üzellik vektürünüo o g o ou uoluşturmaktadır. Bu yaklaşımın en ünemli kısmı metin düzenleme uzaklığı uzerines s o u gükurulan tayfsal übeklemedir.o˙c ü

Özet (Çeviri)

Perit BezekIn this study, the focus is on predicting the subcellular localization of a protein, sincesubcellular localization is helpful in understanding a protein?s functions. Function ofa protein may be estimated from its sequence. Motifs or conserved subsequences arestrong indicators of function. In a given sample set of protein sequences known toperform the same function, a certain subsequence or group of subsequences shouldbe common; that is, occurrence (frequency) of common subsequences should be high.Our idea is to find the common subsequences through clustering and use thesecommon groups (implicit motifs) to classify proteins. To calculate the distance be-tween two subsequences, traditional string edit distance is modified so that onlyreplacement is allowed and the cost of replacement is related to an amino acid substi-tution matrix. Based on the modified string edit distance, spectral clustering embedsthe subsequences into some transformed space for which the clustering problem isexpected to become easier to solve. For a given protein sequence, distribution of itssubsequences over the clusters is the feature vector which is subsequently fed to aclassifier. The most important aspect if this approach is the use of spectral clusteringbased on modified string edit distance.

Benzer Tezler

  1. Prediction of protein subcellular localization using global protein sequence feature

    Evrensel protein dizi özelliğinin kullanılarak protein hücresel sınıflandırılmasının tahmini

    BURÇİN BOZKURT

    Yüksek Lisans

    İngilizce

    İngilizce

    2003

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. VOLKAN ATALAY

  2. A weakly supervised clustering method for cancer subgroup identification

    Kanser alt gruplarının keşfi için zayıf gözetimli bir kümeleme metodu

    DUYGU ÖZÇELİK

    Yüksek Lisans

    İngilizce

    İngilizce

    2016

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. ÖZNUR TAŞTAN OKAN

  3. Unsupervised clustering and its application to discovery of motifs in protein sequences

    Değişik kümeleme teknikleri ve bu teknikler ile protein motiflerinin bulunması

    ERSİN BAŞARAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2001

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ETHEM ALPAYDIN

    DR. UĞUR SEZERMAN

  4. Identification of active disease-associated subnetworks in human protein-protein interaction networks using the MCL algorithm

    MCL algoritması kullanılarak insan protein-protein interaksiyon ağlarında hastalık-ilişkili aktif alt-ağların saptanması

    KIVILCIM ÖZTÜRK

    Yüksek Lisans

    İngilizce

    İngilizce

    2015

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSabancı Üniversitesi

    Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı

    DOÇ. YÜCEL SAYGIN

    PROF. OSMAN UĞUR SEZERMAN

  5. Kümelenmiş protein dizileri kullanarak yapısal özellik tahmini yapan yöntemlere özellik vektörü tasarlamak

    Designing feature vector for methods which predict protein structure by using clustered protein sequences

    SEMA ATASEVER

    Doktora

    Türkçe

    Türkçe

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKırıkkale Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. HASAN ERBAY

    DR. ÖĞR. ÜYESİ ZAFER AYDIN