Parallelization of functional flow to predict protein functions
Protein fonksiyon tahminlemesi için fonksiyonel akış yönteminin paralelleştirilmesi
- Tez No: 276645
- Danışmanlar: YRD. DOÇ. DR. TOLGA CAN
- Tez Türü: Yüksek Lisans
- Konular: Biyoistatistik, Mühendislik Bilimleri, Biostatistics, Engineering Sciences
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2011
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Enformatik Enstitüsü
- Ana Bilim Dalı: Tıp Bilişimi Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 66
Özet
Protein-protein etkileşim ağları, işlevleri bilinmeyen proteinlerin bir hücrede biyolojik fonksiyonlarının ne olabileceği ile ilgili önemli bilgiler sağlarlar. Bu etkileşim ağları, çeşitli yaklaşımların tek bir bilgisayar üzerinde koşturulması ile analiz edilmiş ve işlevleri bilinen proteinlerden bilinmeyenler tahmin edilmeye çalışılmıştır. Fonksiyonel akış; ağ bağlantısallığını, uzaklık etkisini, yerel ve global ağ topolojisini hesaba alma avantajına sahip bir yaklaşımdır. Bu avantajlarıyla protein fonksiyonlarının tahminlenmesinde daha başarılı sonuçlar ürettiği bundan önceki çalışmalarda gösterilmiştir. Ancak, bu yaklaşım için gerçekleştirilen uygulama, gelişmiş canlılar için üretilmekte olan karmaşık ve büyük etkileşim ağları üzerinde bellek yetersizliği nedeniyle pratikte uygulanamamaktadır. Bu tez çalışmasındaki amacımız, Fonksiyonel akış yaklaşımının yüksek başarımlı hesaplama kümesi üzerinde gerçekleştireceğimiz yeni uygulama ile büyük veri setleri üzerinde ölçeklenebilirliğini sağlamaktır. Bu nedenle her biri sekiz çekirdekten oluşan 18 makine üzerine açık kaynak kodlu bir eşle/indirge ortamı olan Hadoop kurulmuştur.Yöntem; ilk eşle/indirge işiyle protein etkileşim ağı, paralel dağıtık hesaplamaya izin verecek formatta tüm hesaplama uçlarına dağıtılır, bir başka eşle/indirge işiyle fonksiyonu bilinen her bir protein için akış üretilir ve üretilen tüm bu akışlar biriktirilerek bilinmeyen herbir protein için fonksiyon tahminlemesinde bulunulur. Yaptığımız deneylerde yüksek hesaplama gerektiren uygulamanın herbir hesaplama ucuna etkili bir şekilde dağıtıldığı ve kaynakların artırılmasıyla uygulamanın yüksek başarımla çalıştığı gözlemlenmiştir.
Özet (Çeviri)
Protein-protein interaction networks provide important information about what the biological function of proteins whose roles are unknown might be in a cell. These interaction networks were analyzed by a variety of approaches by running them on a single computer and the roles of the proteins identified were used to predict the function of the proteins unidentified. The functional flow is an approach that takes the network connectivity, distance effect, topology of the network with local and global views into account. With these advantages, that the functional flow produces more accurate results on the prediction of protein functions was presented by the previos conducted researches. However, the application implemented for this approach could not be practically applied on the large and complex network produced for the complex species because of memory limitation. The purpose of this thesis is to provide a new application be implemented on the high computing performance where the application can be scaled on the large data sets. Therefore, Hadoop, one of the open source map/reduce environments, was installed on 18 hosts each of which has eight cores.Method; the first map/reduce job distributes the protein interaction network as a format which allows parallel distributed computing to all the worker nodes, the other map/reduce job generates flows for each known protein function and the role of the proteins unidentified are predicted by accumulating all of these generated flows. It has been observed in the experiments we performed that the application requiring high performance computing can be decomposed into worker nodes efficiently and the application can provide better performance as the resources increase.
Benzer Tezler
- A finite volume based in-house large eddy simulation solver for turbulent flows in complex geometries
Karmaşık geometrilerde türbülanslı akışlar için sonlu hacimler yöntemine dayanan özgün büyük girdap benzetimi çözücüsü
SARP ER
Yüksek Lisans
İngilizce
2019
Havacılık Mühendisliğiİstanbul Teknik ÜniversitesiUçak ve Uzay Mühendisliği Ana Bilim Dalı
DOÇ. DR. AYŞE GÜL GÜNGÖR
- Parallel implementation of the finite element method on graphics processors for the solution of incompressible flows
Grafik kartlarında paralel bir biçimde çalışacak sonlu elemanlar yöntemi tabanlı sıkıştırılamaz akış çözücü geliştirilmesi
MAHMUT MURAT GÖÇMEN
Yüksek Lisans
İngilizce
2014
Makine MühendisliğiOrta Doğu Teknik ÜniversitesiMakine Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. CÜNEYT SERT
- Parallel solution of unsteady, incompressible three-dimensional Navier-Stokes equations with a new implicit method
Zamana bağlı, sıkıştırılamaz, üç boyutlu Navier-Stokes denklemlerinin yeni bir kapalı metodlar paralel çözümü
VİLDAN ÜSTOĞLU ÜNAL
Doktora
İngilizce
2003
Astronomi ve Uzay Bilimleriİstanbul Teknik ÜniversitesiAstronomi ve Uzay Bilimleri Ana Bilim Dalı
PROF. DR. ÜLGEN GÜLÇAT
- A high-order finite-volume solver for supersonic flows
Ses üstü akışlar için yüksek mertebe bir sonlu hacim çözücüsü
GREGORIO GERARDO SPINELLI
Doktora
İngilizce
2022
Astronomi ve Uzay Bilimleriİstanbul Teknik ÜniversitesiUçak ve Uzay Mühendisliği Ana Bilim Dalı
DOÇ. DR. BAYRAM ÇELİK
- A parallelization approach to Haskell language through category theoretic implementations
Kategori kuramı uygulamaları altında Haskell diline bir paralelizasyon yaklaşımı
BURAK EKİCİ
Yüksek Lisans
İngilizce
2012
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYaşar ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. AHMET HASAN KOLTUKSUZ