A clustering method for the problem of protein subcellular localization
Proteinlerin hücre içi yerleşimlerini bulmak için bir kümeleme yöntemi
- Tez No: 199348
- Danışmanlar: PROF. DR. VOLKAN ATALAY
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Protein Sınıï¬andırma, Hücre Işi Yerleşim, Tayfsal Obekleme, u sgüuMetin Düzeneleme Uzaklığı, Ortük Motiï¬eru, Protein Classiï¬cation, Subcellular Localization, Spectral Clustering, StringEdit Distance, Implicit Motifs
- Yıl: 2006
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 85
Özet
Perit BezekBu calışmanın odak noktası proteinlerin hücre işi yerleşimlerini bulmaktır cunküşs u c s şü uhücre işi yerleşim bir proteinin işlevlerini anlamada gayet yardımcı olacak bilgileru c s sişerir. Bir proteinin işlevleri amino asit dizisinden kestirilebilir. Motiï¬er ya da ko-c srunan altdiziler güclü bir şekilde belirli bir işlevin varlığına işaret eder. Aynı işleveuş u s s g s ssahip olduğu bilinen bir grup protein dizisinde, belirli bir altdizi ya da belirili birgaltdizi grubu sıkşa rastlanır olmalıdır yani bu altdizi gruplarının gürülme sıklığı,c ou gfrekansı, yüksek olmalıdır.uBizim ï¬krimiz bu ortak altdizileri übekleme yüntemi ile bulmak ve onları (implicito oËmotifs) proteinleri sınıï¬andırmak işin kullanmaktır. Iki altdizi arasındaki mesafeyichesaplamak işin geleneksel metin düzenleme uzaklığı, sadece harï¬erin değiştirilmesinec u g gsizin verecek şekilde uyarlanmış ve değişirme masrafı da bir amino asit benzerlik ma-s s gstrisine bağlı olacak hale getirilmiştir. Tayfsal übekleme, bu yeni metin düzenlemeg s o uuzaklığını baz alarak altdizileri başka bir uzaya gündermektedir; büylece kümelemeg s o o uproblemi daha kolay cüzülür hale gelmektedir. Verilen bir protein dizisi işin alt-şo u u cdizilerinin übeklere güre dağılımı bir sınıï¬andırıcıya verilecek olan üzellik vektürünüo o g o ou uoluşturmaktadır. Bu yaklaşımın en ünemli kısmı metin düzenleme uzaklığı uzerines s o u gükurulan tayfsal übeklemedir.oËc ü
Özet (Çeviri)
Perit BezekIn this study, the focus is on predicting the subcellular localization of a protein, sincesubcellular localization is helpful in understanding a protein?s functions. Function ofa protein may be estimated from its sequence. Motifs or conserved subsequences arestrong indicators of function. In a given sample set of protein sequences known toperform the same function, a certain subsequence or group of subsequences shouldbe common; that is, occurrence (frequency) of common subsequences should be high.Our idea is to ï¬nd the common subsequences through clustering and use thesecommon groups (implicit motifs) to classify proteins. To calculate the distance be-tween two subsequences, traditional string edit distance is modiï¬ed so that onlyreplacement is allowed and the cost of replacement is related to an amino acid substi-tution matrix. Based on the modiï¬ed string edit distance, spectral clustering embedsthe subsequences into some transformed space for which the clustering problem isexpected to become easier to solve. For a given protein sequence, distribution of itssubsequences over the clusters is the feature vector which is subsequently fed to aclassiï¬er. The most important aspect if this approach is the use of spectral clusteringbased on modiï¬ed string edit distance.
Benzer Tezler
- Prediction of protein subcellular localization using global protein sequence feature
Evrensel protein dizi özelliğinin kullanılarak protein hücresel sınıflandırılmasının tahmini
BURÇİN BOZKURT
Yüksek Lisans
İngilizce
2003
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. VOLKAN ATALAY
- A weakly supervised clustering method for cancer subgroup identification
Kanser alt gruplarının keşfi için zayıf gözetimli bir kümeleme metodu
DUYGU ÖZÇELİK
Yüksek Lisans
İngilizce
2016
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. ÖZNUR TAŞTAN OKAN
- Unsupervised clustering and its application to discovery of motifs in protein sequences
Değişik kümeleme teknikleri ve bu teknikler ile protein motiflerinin bulunması
ERSİN BAŞARAN
Yüksek Lisans
İngilizce
2001
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. ETHEM ALPAYDIN
DR. UĞUR SEZERMAN
- Identification of active disease-associated subnetworks in human protein-protein interaction networks using the MCL algorithm
MCL algoritması kullanılarak insan protein-protein interaksiyon ağlarında hastalık-ilişkili aktif alt-ağların saptanması
KIVILCIM ÖZTÜRK
Yüksek Lisans
İngilizce
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSabancı ÜniversitesiBilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
DOÇ. YÜCEL SAYGIN
PROF. OSMAN UĞUR SEZERMAN
- Kümelenmiş protein dizileri kullanarak yapısal özellik tahmini yapan yöntemlere özellik vektörü tasarlamak
Designing feature vector for methods which predict protein structure by using clustered protein sequences
SEMA ATASEVER
Doktora
Türkçe
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKırıkkale ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. HASAN ERBAY
DR. ÖĞR. ÜYESİ ZAFER AYDIN