Diverse sequence search and alignment
Sekans aramada çeşitlilik ve hizalama
- Tez No: 335621
- Danışmanlar: DOÇ. DR. HAKAN FERHATOSMANOĞLU
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2013
- Dil: İngilizce
- Üniversite: İhsan Doğramacı Bilkent Üniversitesi
- Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Bölümü
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 64
Özet
BLAST gibi sekans arama araçları, bir sorgu sekansı icin, seçilen veritabanındaki en benzer sonuçları bulmayı amaçlar. Sorguya benzer sonuçlar, kendi içinde de benzerlik göstermektedir. Biyoenformatikteki bir çok analiz yeni aramalar icin daha geniş bir yaklaşım gerektirir ve ilk sıralardaki sonuçların daha farklı çeşitler sunarak yol gösterici olması beklenir. Fakat, su anki arama sistemlerinde çeşitlilik henuz tamamlayıcı bir parça olarak sunulmamaktadır. Tekrar eden sonuçların azaltılması adına, sekans veritabanları oluşturulurken belli bir gereklilik seviyesine bakılmaktadır. Ama, bu durum dinamik olarak oluşturulmuş sonuç kümelerinin gereklilik seviyelerini kontrol etmek icin uygun değildir. Bu tezde, öncelikle, sekans araması için çeşitlilik arama problemi üzerinde durduk. Tüm sorgular ve sonuçlar icin kullanılabilecek çözümler geliştirmeye calıştık. Sekans arama araçlarında alınan sonuçlara uygulanabilecek, olası ceşitlilik olçekleri geliştirdik. Bunların yanı sıra, deneyleri değerlendirmek icin de objektif bir değerlendirme olceği tanımladık. Çeşitlilik algoritmalarının etkinliğini PSI-BLAST aracı kullanılarak alınmış sonuçlar üzerinde değerlendirdik. Ayrıca, sonuçların biyolojik açıdan anlamlı olup olmadığını kontrol etmek için gen ontolojilerinin kullanıldığı bir fonksiyonel çeşitlilik olçeği belirledik. Yaplan deneyler, önerdiğimiz metotların orijinal arama sonuçlarından, hem fonksiyonel hem sekans tabanlı analizlerde istatistiksel olarak daha üstün olduğunu gösterdi. Bunların dışında, gelistirdiğimiz yöntemlerin kullanımını sağlamak için BLAST web servislerini kullanan Div-BLAST adında bir web arama aracı geliştirdik. Bahsi geçen araç öncelikle verilen paramatreleri kullanarak BLAST üzerinde arama yapmakta; daha sonra bu aramada elde edilen sonuçları çeşitlilik unsurunu hesaba katarak yeniden sıralamakta ve BLAST kullanıcılarının alıştığı bir arayüze benzer şekilde sonuçları sunmaktadır.
Özet (Çeviri)
Sequence similarity tools, such as BLAST, seek sequences from a database most similar to a query. They return results signi cantly similar to the query sequence that are typically also highly similar to each other. Most sequence analysis tasks in bioinformatics require an exploratory approach where the initial results guide the user to new searches. However, diversity has not been considered as an integral component of sequence search tools yet. Repetitions in the result can be avoided by introducing non-redundancy during database construction; however, it is not feasible to dynamically set a level of non-redundancy tailored to a query sequence. We introduce the problem of diverse search and browsing in sequence databases that produces non-redundant results optimized for any given query. We de ne diversity measures for sequences, and propose methods to obtain diverse results extracted from current sequence similarity search tools. We propose a new measure to evaluate the diversity of a set of sequences that is returned as a result of a similarity query. We evaluate the e ectiveness of the proposed methods in post-processing PSI-BLAST results. We also assess the functional diversity of the returned results based on available Gene Ontology annotations. Our experiments show that the proposed methods are able to achieve more diverse yet similar result sets compared to static non-redundancy approaches. In both sequence based and functional diversity evaluation, the proposed diversi cation methods outperform original BLAST results signi cantly. We built an online diverse sequence search tool Div-BLAST that supports queries using BLAST web services. It re-ranks the results diversely according to given parameters.
Benzer Tezler
- Cloning and expression of periplasmic (CLpP-LIKE) and memrane-bound serine protease genes of thermoplasma volcanium in escherichia coli
Thermoplasma volcaniumun periplazmik (CLpP-benzeri) ve membrana-bağlı serin proteaz enzim genlerinin escherichia colide klonlanması ve anlatımı
BURÇAK DEMİROK
- Ürün geliştirme projeleri için yalın ilkelere dayalı melez proje kontrol sistemi tasarımı
Hybrid project control system design for product development projects based on lean principles
SERDAR BAYSAN
Doktora
Türkçe
2015
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
PROF. DR. MEHMET BÜLENT DURMUŞOĞLU
- Yapay zeka ve uygulamaları
Artificial intelligence and its applications
A.SEMİH ÖZKUL
Yüksek Lisans
Türkçe
1991
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiY.DOÇ.DR. ORHAN KURUÜZÜM
- Novel waveform design algorithms for pulse compression radars
Darbe sıkıştırma radarları için yenilikçi dalgaformu tasarım algoritmaları
KUBİLAY SAVCI
Doktora
İngilizce
2022
Elektrik ve Elektronik MühendisliğiKoç ÜniversitesiElektrik ve Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. ALPER TUNGA ERDOĞAN
- Molecular evolution and phylogeography of the Eastern Mediterranean water frog (Pelophylax) complex
Doğu Akdeniz su kurbağaları (Pelophylax) kompleksinin moleküler evrimi ve filocoğrafyası
ÇİĞDEM AKIN PEKŞEN
Doktora
İngilizce
2015
BiyolojiOrta Doğu Teknik ÜniversitesiBiyoloji Ana Bilim Dalı
DOÇ. DR. C. CAN BİLGİN
DOÇ. DR. JORG PLOTNER