Geri Dön

Biyoinformatik sekanslar için dizi eşleştirme algoritmaları üzerine bir çalışma

A study on string matching algorithms for bioinformatics sequences

  1. Tez No: 728660
  2. Yazar: ABDULLAH AMMAR KARCIOĞLU
  3. Danışmanlar: DOÇ. DR. HASAN BULUT
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: Türkçe
  9. Üniversite: Ege Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 106

Özet

Dizi arama, izinsiz giriş tespit sistemleri, dolandırıcılık tespiti, biyoinformatik sekanslarda örüntü arama gibi dizi eşleştirme algoritmaları bilgisayar biliminin temel alanları arasındadır. Kesin dizi eşleştirme algoritmaları tekli ve çoklu olmak üzere iki kısma ayrılır. Tekli kesin dizi eşleştirme algoritmaları, bir T metninde bir P dizisinin tüm oluşumlarını bulmayı içerir. Bu algoritmalar, öncelikle metin arama ve hesaplamalı biyoloji gibi çeşitli alanlardaki uygulamaları nedeniyle bilgisayar bilimlerinde kapsamlı bir şekilde incelenmiştir. Çoklu kesin dizi eşleştirme algoritmaları, belirli bir T metninde |P| dizi kümesinin elemanlarını bulmayı içerir. Kesin dizi eşleştirme algoritmalarının temel amacı, mümkün olan en kısa zaman çerçevesinde tüm dizi eşleşmelerini doğru bir şekilde bulmaktır. Bu nedenle literatürde var olan kesin dizi eşleştirme algoritmalarındaki eksiklikler tespit edilip daha verimli yeni yaklaşımlar geliştirilmelidir. Bu tez çalışmasında, DNA sekanslarına yönelik tekli ve çoklu kesin dizi eşleştirme algoritmaları geliştirilmiştir. Dizi eşleştirme işlemleri, DNA dizileri için zaman açısından verimli bir şekilde yapılmalıdır. T metninin hacmi arttıkça ve aranan dizilerin sayısı arttıkça toplam çalışma süresi artar. Bu arama işlemlerini en kısa sürede gerçekleştirmek için verimli algoritmalar seçilmelidir. Yapılan deneysel çalışmalar sonucu geliştirilen yaklaşımların literatürdeki diğer yaklaşımlara kıyasen performans metrikleri açısından daha başarılı sonuçlar elde ettiği gösterilmiştir.

Özet (Çeviri)

The string matching algorithms are among the essential fields in computer science, such as text search, intrusion detection systems, fraud detection, and pattern search in bioinformatics sequences. The exact string matching algorithms are divided into two parts as single and multiple.Single exact string matching algorithms involve finding all occurrences of a pattern P in a text T. These algorithms have been extensively studied in computer science, primarily because of their applications in various fields such as text search and computational biology. Multiple string matching algorithms involve finding elements of the pattern set |P| in a given input text T. The main goal of exact string matching algorithms is to find all pattern matches correctly within the shortest possible time frame. For this reason, the limitations of exact string matching algorithms in the literature should be determined and more efficient new approaches should be developed. In this thesis, single and multiple exact string matching algorithms for DNA sequences have been developed. String matching processes should be done in a time-efficient manner for DNA sequences. As the volume of the text T increases and the number of search patterns increases, the total runtime increases. Efficient algorithms should be selected to perform these search operations as soon as possible. As a result of the experimental studies, it has been shown that the developed approaches have achieved more successful results in terms of performance metrics compared to other approaches in the literature.

Benzer Tezler

  1. Şeker hastalığı tedavisinde kullanılan insulin(INS) geninin hayvan türlerindeki gen uyumunun tespiti

    Determination of compatibility of animal species' insulin (INS) gene used in diatebes treatment

    MERVE BAHAR DOĞAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2020

    BiyomühendislikKocaeli Üniversitesi

    Biyomedikal Mühendisliği Ana Bilim Dalı

    PROF. DR. EMİNE BOLAT

  2. Identification of alternative oxidase encoding genes in Caulerpa cylindracea

    Caulerpa cylindracea türünde alternatif oksidaz kodlayan genlerin tanımlanması

    ÖMER CAN ÜNÜVAR

    Yüksek Lisans

    İngilizce

    İngilizce

    2016

    BiyokimyaAbant İzzet Baysal Üniversitesi

    Kimya Ana Bilim Dalı

    DR. ERCAN SELÇUK ÜNLÜ

  3. Çoklu dizi hizalama probleminin yapay arı koloni algoritması ile çözülmesi

    Solving multiple sequence alignment problem with artificial bee colony algorithm

    SELÇUK ASLAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2013

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolErciyes Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. CELAL ÖZTÜRK

  4. Mining fungal effector candidates in biotrophic plant pathogens; rusts and mildews

    Biyotrofik bitki patojenlerinde (pas ve küf) aday efektör tespiti

    SİNAN UĞUR UMU

    Yüksek Lisans

    İngilizce

    İngilizce

    2012

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Biyoenformatik Bölümü

    DOÇ. DR. TOLGA CAN

    PROF. DR. MAHİNUR S. AKKAYA

  5. Küçük hücreli dışı akciğer kanserinde cisplatin direnci gelişiminde rol oynayan genetik faktörlerin CRISPR-CAS9 tabanlı tüm genom tarama sistemiyle belirlenmesi

    Determination of genetic factors role in the development of cisplatin resistance in non-small cell lung cancer by CRISPR-CAS9 based whole genome screening system

    HALE GÜLER KARA

    Doktora

    Türkçe

    Türkçe

    2021

    Tıbbi BiyolojiEge Üniversitesi

    Tıbbi Biyoloji Ana Bilim Dalı

    DOÇ. DR. BUKET KOSOVA