Geri Dön

Dağıtık DVM kullanılarak miRNA hedef gen tahmini yapılması

miRNA target gene prediction using distributed SVM

  1. Tez No: 268373
  2. Yazar: NİYAZİ ELVAN
  3. Danışmanlar: YRD. DOÇ. DR. A. GÖKHAN YAVUZ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Biyoistatistik, Biyomühendislik, Computer Engineering and Computer Science and Control, Biostatistics, Bioengineering
  6. Anahtar Kelimeler: Destek Vektör Makinesi, Paralel Hesaplama, miRNA hedef gen tahmini, biyoenformatik
  7. Yıl: 2009
  8. Dil: Türkçe
  9. Üniversite: Yıldız Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 58

Özet

Son yıllarda mikrobiyoloji alanındaki gelismeler bu alana bilgisayar bilimlerinin desteğiningiderek artması ile ivme kazanmıstır. Mikrobiyolojinin en etkili alt dallarından biri de Genetikbilimidir. Genetik özellikle günümüzde üzerinde en çok çalısma yapılan alanlardan biridir.Gen ve Genom arastırmaları, proteinlerin üç boyutlu yapılarının tespiti, DNA dizilimlerinkesfi gibi gelismeler bu konu üzerinde çalısan arastırmacıları heyecanlandıran gelismelerolarak nitelendirilebilir. Zira yapılan her çalısma yeni bir çalısma alanı doğurmakla kalmayıpgünlük hayatta çok hızlı uygulanabilen çözümlere dönüstürülebilmektedir.Yapılan arastırmaların ve ortaya çıkan ihtiyaçlarının bir sonucu olarak bilgisayar bilimleri,mikrobiyoloji ve istatistik bilimlerinin bir bileskesi olan Biyoenformatik bilimi türemistir.Biyoenformatik bu üç bilim dalını çok iyi bir sekilde yorumlayarak ortaya sasırtıcı sonuçlarkoyabilmektedir. DNA ve RNA dizilerinin kesfinin ardından, bunlara ait dizilimlerin eldeedilmesi ve akabinde bu dizilimlerin istatistik ve bilgisayar bilimleri yöntemleri ısığındadeğerlendirilmesi biyoenformatiğin ilgilendiği konuların basında gelir. Bu konularla ilgiliçalısmalar sürerken biyolojik gelismeler de olmustur. Varlığı ilk kez 1993 yılında kesfedilenve ancak 2001'de ismi konulan miRNA molekülleri bugün Biyoenformatik alanında çalısanbirçok arastırmacının gözdesi olmustur. Baslangıçta hücre içindeki islevinin tam olarak neolduğu bilinmezken bugün belirli miRNA türlerinin hücrede ne isleve sahip olduğubilinmektedir.miRNA hakkındaki çalısmalar genel olarak iki ayrı dalda ilerlemektedir. Birinci alanmiRNA'ların kalıtsal olarak iletilip iletilemediğini, hangi süreçlerden etkilendiğini ve bumoleküllerin nasıl olustuğunu arastırır. Diğer alan ise miRNA'ların hangi süreçlere, nasıl etkiettiğini ve hedef aldığı genleri arastırır. Bu çalısmada miRNA'ların hedef aldığı genlerinbilinen örneklerden yola çıkılarak makine öğrenmesi yöntemlerinden DVM kullanılaraktahmin edilmesi hedeflenmistir. Üç ana parçadan olusan sistem, ilk asamada DVM için veritoplanması ve bu verilerden özellik kümesi dikkate alınarak özellik çıkarılmasını sağlar.?kinci asamada olusturulan özelliklerin öğrenme verisi olarak kullanılması ve DVM'nineğitilmesi söz konusudur. Son asama ise DVM'in sınanması ve sorgulanabilir sekilde hazırduruma getirilmesidir.Önceki uygulamalar incelendiğinde DVM'lerin islemci zamanı düsünüldüğünde yüksekbasarım gerektirdiği bilinmektedir. Bu çalısmayı olusturan üç ana parça mpich kütüphanesikullanılarak paralel ortamda gelistirilmistir. Uygulamaların tek islemci üzerinde çalısan diğeruygulamalara göre yüksek oranda basarım elde ettiği görülmüstür. Bu sayede çok büyük verikümelerinin islenmesi için harcanacak sürenin de büyük oranda azalacağı öngörülmektedir.

Özet (Çeviri)

In recent years, the improvement of Microbiology has been enhanced by the help of Computer Sciences. Genetics, one of the main branches of Microbiology, has emerged as a challenging area of research. Improvements such as prediction of protein 3D stuctures, Gene/Genome expressions and DNA sequence analysis has arised with the interest of many researchers.Bioinformatics is the application of information technology to the field of molecular biology. The term bioinformatics was coined by Paulien Hogeweg in 1979 for the study of informatic processes in biotic systems. Bioinformatics now entails the creation and advancement of databases, algorithms, computational and statistical techniques, and theory to solve formal and practical problems arising from the management and analysis of biological data. Over the past few decades rapid developments in genomic and other molecular research technologies and developments in information technologies have combined to produce a tremendous amount of information related to molecular biology. It is the name given to these mathematical and computing approaches used to glean understanding of biological processes. Common activities in bioinformatics include mapping and analyzing DNA and protein sequences, aligning different DNA and protein sequences to compare them and creating and viewing 3-D models of protein structures.MicroRNA (miRNA) is a small non-coding RNA which plays a significant role in plants and animals as a regulator in gene expression. A mature miRNA generally binds to the 3? site of its target gene which is usually complementary to binding site of miRNA. There are already computational methods proposed for predicting miRNA targets. Most of these methods focused on biological aspects of the problem and are lacking computational state-of-the-art.This thesis work proposes a method used for fastening the feature extraction from miRNA&Target Gene sequence data for support vector machine (SVM) taking the advantage of parallel programming. A parallel algorithm has been implemented that takes the sequence data of miRNA::Target Gene pairs as input and calculates the structural, thermo-dynamical and position-based features for SVM as output. Using the data partitioning technique, each computing node performs the calculations on sequence files pointed by the main node and sends the result to it. We have measured the scalability of our algorithm on a parallel cluster environment. The more computing nodes exist, the less computing time is spent.

Benzer Tezler

  1. Apache spark tabanlı destek vektör makıneleri ile akan büyük veri sınıflandırma

    Apache spark based distributed svm algorithm for stream data classification

    BARIŞ AKGÜN

    Yüksek Lisans

    Türkçe

    Türkçe

    2016

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ŞULE GÜNDÜZ ÖĞÜDÜCÜ

  2. Predicting performance measures of a multiprocessor architecture by using machine learning methods

    Makine öğrenmesi metodları kullanılarak çoklu işlemci mimarisinin performans ölçümlerini tahmin etme

    ELRASHEED İSMAİL MOHOMMOUD ZAYİD

    Doktora

    İngilizce

    İngilizce

    2012

    Elektrik ve Elektronik MühendisliğiÇukurova Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. MEHMET FATİH AKAY

  3. Bulut bilişim sistemlerinde eşle/indirge yöntemi uygulanarak veri madenciliği yazılım çatısının geliştirilmesi

    Development of data mining software framework by using map/reduce method in cloud computing systems

    FERHAT ÖZGÜR ÇATAK

    Doktora

    Türkçe

    Türkçe

    2014

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Üniversitesi

    Enformatik Ana Bilim Dalı

    PROF. DR. MEHMET ERDAL BALABAN

  4. Yaşam kalitesi endeksi tabanlı bileşik makine öğrenme teknikleriyle yaşam alanı tahmin modeli

    A living environment prediction model using ensemble machine learning techniques based on life quality index

    ZÜLFİYE ERDOĞAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2017

    Endüstri ve Endüstri Mühendisliğiİstanbul Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. ERSİN NAMLI

  5. Yüksek gerilim enerji iletim hattındaki arızaların dalgacık paket dönüşümü ve ortak vektör yaklaşımıyla sınıflandırılması

    The classification of faults in high voltage energy transmission line by using wavelet packet transform and common vector approach

    MEHMET YUMURTACI

    Doktora

    Türkçe

    Türkçe

    2014

    Elektrik ve Elektronik MühendisliğiMarmara Üniversitesi

    Elektrik Eğitimi Ana Bilim Dalı

    DOÇ. DR. GÖKHAN GÖKMEN

    PROF. DR. OSMAN KILIÇ