Biyoinformatik sekanslar için dizi eşleştirme algoritmaları üzerine bir çalışma
A study on string matching algorithms for bioinformatics sequences
- Tez No: 728660
- Danışmanlar: DOÇ. DR. HASAN BULUT
- Tez Türü: Doktora
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: Türkçe
- Üniversite: Ege Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
- Sayfa Sayısı: 106
Özet
Dizi arama, izinsiz giriş tespit sistemleri, dolandırıcılık tespiti, biyoinformatik sekanslarda örüntü arama gibi dizi eşleştirme algoritmaları bilgisayar biliminin temel alanları arasındadır. Kesin dizi eşleştirme algoritmaları tekli ve çoklu olmak üzere iki kısma ayrılır. Tekli kesin dizi eşleştirme algoritmaları, bir T metninde bir P dizisinin tüm oluşumlarını bulmayı içerir. Bu algoritmalar, öncelikle metin arama ve hesaplamalı biyoloji gibi çeşitli alanlardaki uygulamaları nedeniyle bilgisayar bilimlerinde kapsamlı bir şekilde incelenmiştir. Çoklu kesin dizi eşleştirme algoritmaları, belirli bir T metninde |P| dizi kümesinin elemanlarını bulmayı içerir. Kesin dizi eşleştirme algoritmalarının temel amacı, mümkün olan en kısa zaman çerçevesinde tüm dizi eşleşmelerini doğru bir şekilde bulmaktır. Bu nedenle literatürde var olan kesin dizi eşleştirme algoritmalarındaki eksiklikler tespit edilip daha verimli yeni yaklaşımlar geliştirilmelidir. Bu tez çalışmasında, DNA sekanslarına yönelik tekli ve çoklu kesin dizi eşleştirme algoritmaları geliştirilmiştir. Dizi eşleştirme işlemleri, DNA dizileri için zaman açısından verimli bir şekilde yapılmalıdır. T metninin hacmi arttıkça ve aranan dizilerin sayısı arttıkça toplam çalışma süresi artar. Bu arama işlemlerini en kısa sürede gerçekleştirmek için verimli algoritmalar seçilmelidir. Yapılan deneysel çalışmalar sonucu geliştirilen yaklaşımların literatürdeki diğer yaklaşımlara kıyasen performans metrikleri açısından daha başarılı sonuçlar elde ettiği gösterilmiştir.
Özet (Çeviri)
The string matching algorithms are among the essential fields in computer science, such as text search, intrusion detection systems, fraud detection, and pattern search in bioinformatics sequences. The exact string matching algorithms are divided into two parts as single and multiple.Single exact string matching algorithms involve finding all occurrences of a pattern P in a text T. These algorithms have been extensively studied in computer science, primarily because of their applications in various fields such as text search and computational biology. Multiple string matching algorithms involve finding elements of the pattern set |P| in a given input text T. The main goal of exact string matching algorithms is to find all pattern matches correctly within the shortest possible time frame. For this reason, the limitations of exact string matching algorithms in the literature should be determined and more efficient new approaches should be developed. In this thesis, single and multiple exact string matching algorithms for DNA sequences have been developed. String matching processes should be done in a time-efficient manner for DNA sequences. As the volume of the text T increases and the number of search patterns increases, the total runtime increases. Efficient algorithms should be selected to perform these search operations as soon as possible. As a result of the experimental studies, it has been shown that the developed approaches have achieved more successful results in terms of performance metrics compared to other approaches in the literature.
Benzer Tezler
- Şeker hastalığı tedavisinde kullanılan insulin(INS) geninin hayvan türlerindeki gen uyumunun tespiti
Determination of compatibility of animal species' insulin (INS) gene used in diatebes treatment
MERVE BAHAR DOĞAN
Yüksek Lisans
Türkçe
2020
BiyomühendislikKocaeli ÜniversitesiBiyomedikal Mühendisliği Ana Bilim Dalı
PROF. DR. EMİNE BOLAT
- Identification of alternative oxidase encoding genes in Caulerpa cylindracea
Caulerpa cylindracea türünde alternatif oksidaz kodlayan genlerin tanımlanması
ÖMER CAN ÜNÜVAR
Yüksek Lisans
İngilizce
2016
BiyokimyaAbant İzzet Baysal ÜniversitesiKimya Ana Bilim Dalı
DR. ERCAN SELÇUK ÜNLÜ
- Çoklu dizi hizalama probleminin yapay arı koloni algoritması ile çözülmesi
Solving multiple sequence alignment problem with artificial bee colony algorithm
SELÇUK ASLAN
Yüksek Lisans
Türkçe
2013
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolErciyes ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. CELAL ÖZTÜRK
- Mining fungal effector candidates in biotrophic plant pathogens; rusts and mildews
Biyotrofik bitki patojenlerinde (pas ve küf) aday efektör tespiti
SİNAN UĞUR UMU
Yüksek Lisans
İngilizce
2012
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiBiyoenformatik Bölümü
DOÇ. DR. TOLGA CAN
PROF. DR. MAHİNUR S. AKKAYA
- Küçük hücreli dışı akciğer kanserinde cisplatin direnci gelişiminde rol oynayan genetik faktörlerin CRISPR-CAS9 tabanlı tüm genom tarama sistemiyle belirlenmesi
Determination of genetic factors role in the development of cisplatin resistance in non-small cell lung cancer by CRISPR-CAS9 based whole genome screening system
HALE GÜLER KARA