Geri Dön

Diverse sequence search and alignment

Sekans aramada çeşitlilik ve hizalama

  1. Tez No: 335621
  2. Yazar: ELİF ESER
  3. Danışmanlar: DOÇ. DR. HAKAN FERHATOSMANOĞLU
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2013
  8. Dil: İngilizce
  9. Üniversite: İhsan Doğramacı Bilkent Üniversitesi
  10. Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Bölümü
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 64

Özet

BLAST gibi sekans arama araçları, bir sorgu sekansı icin, seçilen veritabanındaki en benzer sonuçları bulmayı amaçlar. Sorguya benzer sonuçlar, kendi içinde de benzerlik göstermektedir. Biyoenformatikteki bir çok analiz yeni aramalar icin daha geniş bir yaklaşım gerektirir ve ilk sıralardaki sonuçların daha farklı çeşitler sunarak yol gösterici olması beklenir. Fakat, su anki arama sistemlerinde çeşitlilik henuz tamamlayıcı bir parça olarak sunulmamaktadır. Tekrar eden sonuçların azaltılması adına, sekans veritabanları oluşturulurken belli bir gereklilik seviyesine bakılmaktadır. Ama, bu durum dinamik olarak oluşturulmuş sonuç kümelerinin gereklilik seviyelerini kontrol etmek icin uygun değildir. Bu tezde, öncelikle, sekans araması için çeşitlilik arama problemi üzerinde durduk. Tüm sorgular ve sonuçlar icin kullanılabilecek çözümler geliştirmeye calıştık. Sekans arama araçlarında alınan sonuçlara uygulanabilecek, olası ceşitlilik olçekleri geliştirdik. Bunların yanı sıra, deneyleri değerlendirmek icin de objektif bir değerlendirme olceği tanımladık. Çeşitlilik algoritmalarının etkinliğini PSI-BLAST aracı kullanılarak alınmış sonuçlar üzerinde değerlendirdik. Ayrıca, sonuçların biyolojik açıdan anlamlı olup olmadığını kontrol etmek için gen ontolojilerinin kullanıldığı bir fonksiyonel çeşitlilik olçeği belirledik. Yaplan deneyler, önerdiğimiz metotların orijinal arama sonuçlarından, hem fonksiyonel hem sekans tabanlı analizlerde istatistiksel olarak daha üstün olduğunu gösterdi. Bunların dışında, gelistirdiğimiz yöntemlerin kullanımını sağlamak için BLAST web servislerini kullanan Div-BLAST adında bir web arama aracı geliştirdik. Bahsi geçen araç öncelikle verilen paramatreleri kullanarak BLAST üzerinde arama yapmakta; daha sonra bu aramada elde edilen sonuçları çeşitlilik unsurunu hesaba katarak yeniden sıralamakta ve BLAST kullanıcılarının alıştığı bir arayüze benzer şekilde sonuçları sunmaktadır.

Özet (Çeviri)

Sequence similarity tools, such as BLAST, seek sequences from a database most similar to a query. They return results signi cantly similar to the query sequence that are typically also highly similar to each other. Most sequence analysis tasks in bioinformatics require an exploratory approach where the initial results guide the user to new searches. However, diversity has not been considered as an integral component of sequence search tools yet. Repetitions in the result can be avoided by introducing non-redundancy during database construction; however, it is not feasible to dynamically set a level of non-redundancy tailored to a query sequence. We introduce the problem of diverse search and browsing in sequence databases that produces non-redundant results optimized for any given query. We de ne diversity measures for sequences, and propose methods to obtain diverse results extracted from current sequence similarity search tools. We propose a new measure to evaluate the diversity of a set of sequences that is returned as a result of a similarity query. We evaluate the e ectiveness of the proposed methods in post-processing PSI-BLAST results. We also assess the functional diversity of the returned results based on available Gene Ontology annotations. Our experiments show that the proposed methods are able to achieve more diverse yet similar result sets compared to static non-redundancy approaches. In both sequence based and functional diversity evaluation, the proposed diversi cation methods outperform original BLAST results signi cantly. We built an online diverse sequence search tool Div-BLAST that supports queries using BLAST web services. It re-ranks the results diversely according to given parameters.

Benzer Tezler

  1. Cloning and expression of periplasmic (CLpP-LIKE) and memrane-bound serine protease genes of thermoplasma volcanium in escherichia coli

    Thermoplasma volcaniumun periplazmik (CLpP-benzeri) ve membrana-bağlı serin proteaz enzim genlerinin escherichia colide klonlanması ve anlatımı

    BURÇAK DEMİROK

    Yüksek Lisans

    İngilizce

    İngilizce

    2006

    BiyolojiOrta Doğu Teknik Üniversitesi

    PROF.DR. SEMRA KOCABIYIK

  2. Ürün geliştirme projeleri için yalın ilkelere dayalı melez proje kontrol sistemi tasarımı

    Hybrid project control system design for product development projects based on lean principles

    SERDAR BAYSAN

    Doktora

    Türkçe

    Türkçe

    2015

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    PROF. DR. MEHMET BÜLENT DURMUŞOĞLU

  3. Yapay zeka ve uygulamaları

    Artificial intelligence and its applications

    A.SEMİH ÖZKUL

  4. Novel waveform design algorithms for pulse compression radars

    Darbe sıkıştırma radarları için yenilikçi dalgaformu tasarım algoritmaları

    KUBİLAY SAVCI

    Doktora

    İngilizce

    İngilizce

    2022

    Elektrik ve Elektronik MühendisliğiKoç Üniversitesi

    Elektrik ve Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. ALPER TUNGA ERDOĞAN

  5. Molecular evolution and phylogeography of the Eastern Mediterranean water frog (Pelophylax) complex

    Doğu Akdeniz su kurbağaları (Pelophylax) kompleksinin moleküler evrimi ve filocoğrafyası

    ÇİĞDEM AKIN PEKŞEN

    Doktora

    İngilizce

    İngilizce

    2015

    BiyolojiOrta Doğu Teknik Üniversitesi

    Biyoloji Ana Bilim Dalı

    DOÇ. DR. C. CAN BİLGİN

    DOÇ. DR. JORG PLOTNER