Dna sıralarındaki tekrarlı örüntülerin ve potansiyel motiflerin veri madenciliği yöntemiyle çıkarılması
Extraction of frequent patterns and potential motifs from dna sequences with data mining method
- Tez No: 185461
- Danışmanlar: YRD. DOÇ. DR. MEHMET KAYA
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Mühendislik Bilimleri, Computer Engineering and Computer Science and Control, Engineering Sciences
- Anahtar Kelimeler: Veri madenciliği, biyoenformatik, motif bulma problemi, tekrarlıörüntüler, Data mining, bioinformatics, motif finding problem, frequent patterns
- Yıl: 2006
- Dil: Türkçe
- Üniversite: Fırat Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 55
Özet
ÖZETYÜKSEK LİSANS TEZİDNA SIRALARINDAKİ TEKRARLI ÖRÜNTÜLERİN VEPOTANSİYEL MOTİFLERİNVERİ MADENCİLİĞİ YÖNTEMİYLE ÇIKARILMASIUlaş Baran BALOĞLUFırat ÜniversitesiFen Bilimleri EnstitüsüBilgisayar Mühendisliği Anabilim Dalı2006, Sayfa: 45Bu tezde DNA veri kümesinde bulunan biyolojik sıralar üzerinde veri madenciliğiyapılarak tekrarlı örüntüler ve potansiyel motifler çıkartılmıştır. Motif bulma problemi olarakadlandırılan bu konuda yapılmış başka çalışmalar da mevcuttur. Fakat çoklu dizi hizalamasıkullanan bu çalışmalar performans açısından kötü sonuç vermektedir.Önerilen yöntem yukarıdan-aşağı veri madenciliği ve genetik algoritma tabanlı hibrit birçözümdür. Bu yöntemdeki yaklaşım iki temel adımda ele alınabilir. Birinci adım, genetikalgoritma kullanılarak aday motiflerin bir popülasyonun oluşturulmasıdır, bunu diğer nesilleringenetik operatörler ve uygunluk fonksiyonu kullanılarak oluşturulması takip eder. İkinci adımda,veri madenciliği yöntemi yukarıdan-aşağı haliyle kullanılarak aday motiflerin uygunluğunundeğerlendirilmesi yapılır.E. coli bakterilerinden alınmış DNA sıralarında önerilen yöntem denenerekuygulanabilirliği ve üstün yanları gösterilmiştir.
Özet (Çeviri)
ABSTRACTMS ThesisEXTRACTION OF FREQUENT PATTERNSAND POTENTIAL MOTIFS FROM DNA SEQUENCESWITH DATA MINING METHODUlaş Baran BALOĞLUFırat UniversityGraduate School of Natural and Applied SciencesDepartment of Computer Engineering2006, Page: 45In this thesis, data mining is applied on DNA datasets in order to extract potential motifsand frequent patterns. There are also other studies on this subject, called motif finding orextraction problem. However, many of those studies suffered from bad performance caused byusage of multiple sequence alignment method.The proposed method is a hybrid solution, which is based on top-down data mining andgenetic algorithm. There are two main motivations of this approach. First, we use geneticalgorithm to create a population of candidate motifs, then to create next generations according tousage of fitness function and genetic operators. Second, we use data mining in a top-downmanner to evaluate fitness of candidate motifs.The proposed method was tested on DNA sequences of E.coli bacterias in order to showits superior parts and applicability.
Benzer Tezler
- Doğal maddelerin (Biyohumus ve Baykal EM1) doğu kayınında (Fagus orientalis Lipsky.) bazı morfolojik-fizyolojik proseslere etkisi
Effects of natural substances (Biohumus and Baykal EM1) on certain morphological -physiological prosesses of eastern beech (Fagus orientalis Lipsky.)
HÜSEYİN ATİLLA ATİK
Doktora
Türkçe
2008
Ormancılık ve Orman MühendisliğiZonguldak Karaelmas ÜniversitesiOrman Endüstri Mühendisliği Ana Bilim Dalı
PROF. DR. SURHAY ALLAHVERDİ
- Aydın/Türkiye'de echinococcus granulosus'un mitokondriyal sitokrom c oksidaz subunit 1 gen bölgesinin sekanslanarak moleküler karakterizasyonunun araştırılması
Molecular characterisation of echinococcus granulosus isolates from Aydin/Turkey BY sequenci̇ng of mitochondrial cytochrome c oxidase I
AYLİN BABAOĞLU
Doktora
Türkçe
2015
ParazitolojiAdnan Menderes ÜniversitesiParazitoloji Ana Bilim Dalı
PROF. DR. HATİCE ERTABAKLAR
- Değişken alan jel elektroforezi yöntemi ile salmonella serotiplerinin tanısı
Identification of salmonella serotypes by pulsed field gel electrophoresis
AHMET CANER SÖNMEZ
- Çanakkale koşullarında yetiştirilen Stevia rebaudiana bitkisinin bazı bitkisel özelliklerinin belirlenmesi ve moleküler tanımlanması
Determination of some plant characteristics and molecular identification of Stevia rebaudiana plant grown in Çanakkale
GÜLNUR KARAOĞLU
Yüksek Lisans
Türkçe
2019
BiyoteknolojiÇanakkale Onsekiz Mart ÜniversitesiTarımsal Biyoteknoloji Ana Bilim Dalı
PROF. DR. İSKENDER TİRYAKİ
- Mide kanserli hastalarda periferik kanda Telomeraz mRNA ekspresyonunun real time-PCR kullanılarak belirlenmesi ve klinikopatolojik özelliklerle ilişkisinin saptanması
The determination of telomerase mRNA expression in peripheric blood by real time-PCR and of association with clinicopathological parameters in patients with gastric cancer.
HAMDULLAH TURHAN
Tıpta Uzmanlık
Türkçe
2008
BiyokimyaAtatürk ÜniversitesiBiyokimya Ana Bilim Dalı
PROF. DR. EBUBEKİR BAKAN