Employing data mining techniques on biological sequences for transcription factor binding site identification
Biyolojik dizilimler üzerinde veri madenciliği teknikleri kullanarak trankripsiyon faktörü bağlanma sitelerinin tespiti
- Tez No: 299421
- Danışmanlar: YRD. DOÇ. DR. TURGAY İBRİKÇİ
- Tez Türü: Doktora
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2011
- Dil: İngilizce
- Üniversite: Çukurova Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 92
Özet
Transkripsiyon faktörü bağlanma sitelerinin (TFBS) tanımlanması modern biyolojide genom fonksiyonları ve gen düzenleyici ağlarını çözümlenmesi doğrultusunda önemli bir süreçtir. Bu alanların tanımlanmasının bir yolu yoğun emek isteyen, zaman alıcı ve pahalı laboratuar deneyleridir. Bu deneylere alternatif olarak, TFBS alanlarının verilen DNA dizilimlerinden otomatik olarak çıkaran, desen tanıma temelli bilgisayar yöntemleri de ilgili literatürde bulunmaktadır.Bu çalışmada üç farklı hesapsal yöntem önerilmektedir. Önerilen birinci yaklaşım verilen tüm w-mer'leri kümeleme ve z-score testi kullanarak istatistiksel olarak ilginç bir yerel hizalama bulmaya çalışmaktadır. Dört kümeleme metodu bu bağlamda değerlendirilmiştir, bunlar: Self-organizing map, Fuzzy C-Means, K-means ve Expectation Maximization algoritmalarıdır. İkinci teknik ise birinci tekniğe oldukça benzemekle beraber, farklı olarak, pozisyon ağırlık matrislerinden oluşan yerel hizalamaları iyileştirmek için Bayes teoremi temelli kümeleme sonrası optimizasyon prosedürü içermektedir. Bu tezde geliştirilen üçüncü hesapsal teknik ise parçacık sürü optimizasyonu adlı bir stokastik arama prosedürünü benimsemektedir. Geliştirilen metotlar, ilgili literatüre yeni katkılar sağlamak amacıyla düşük ve yüksek canlı DNA'sı içeren pek çok veri seti kullanılarak değerlendirilmiştir. Dahası, literatürden MEME ve MDScan gibi gelişmiş metotlar da kıyaslanmışlardır. Deneysel sonuçlar önerilen metotların DNA motif-bulma işi için oldukça umut vaat edici olduğunu göstermiştir.
Özet (Çeviri)
Identification of transcription factor binding sites (TFBSs) is a significant task in contemporary biology towards deciphering the genome functions and understanding gene regulatory networks. One way to identify them is via laboratory experiments which are laborious, time consuming and costly. Alternatively, computational methods based on pattern recognition techniques are proposed in the literature for automatic extraction of TFBS instances from given DNA sequences.In this study, three different computational methods are proposed. First approach is based on clustering all w-mers and attempting to find a statistically interesting local alignment via z-score testing. Four clustering methods, Self-organizing map, Fuzzy C-Means, K-means and Expectation Maximization with Gaussian Mixture Models, are considered in this context. The second technique is similar to the first one except that it has a Bayesian post-optimization procedure to fine-tune local alignments composed of Position weight matrices. The third computational technique developed in the thesis adopts a different approach by utilizing a stochastic search procedure, namely Particle swarm optimization. The developed methods each of which offers novel contributions to the relevant literature are evaluated against several types of datasets including low and high organism DNA. Moreover, they are also compared to state-of-art motif-finding tools from the literature such as MEME and MDScan, as well. Experimental results suggest that the proposed methods are highly promising for DNA motif-finding task.
Benzer Tezler
- Large scale characterization of protein interactions: Identification of hot spots and spatial motifs in protein-protein interfaces
Protein etkileşimlerinin geniş ölçekli nitelendirilmesi: Protein-protein arayüzlerindeki sıcak noktaların ve uzaysal desenlerin belirlenmesi
EMRE GÜNEY
Yüksek Lisans
İngilizce
2007
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKoç ÜniversitesiElektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. ATTİLA GÜRSOY
- Polianilin ve polidopamin kopolimerlerinin sentezi, PbI2 ile doplanması ve spektroskopik incelenmesi
Synthesis of polyaniline and polydopamine copolymers, doping with PbI2 and spectroscopic investigation
MERVE HERCAN MAMMAD
Doktora
Türkçe
2024
Polimer Bilim ve TeknolojisiSakarya ÜniversitesiKimya Ana Bilim Dalı
PROF. DR. MUSTAFA GÜLFEN
- Banka çağrı merkezinin bono satış verilerinin sınıflandırmaalgoritmaları ile analizi
Analysis of bond sales data of the banking call centerby classification algorithms
ERKAN ŞEKER
Yüksek Lisans
Türkçe
2021
Maden Mühendisliği ve MadencilikBahçeşehir ÜniversitesiBilgi Teknolojileri Ana Bilim Dalı
DOÇ. DR. YÜCEL BATU SALMAN
- Use of data mining techniques to determine presence of coronary artery disease and deriving a risk score by employing risk factors
Veri madenciliği tekniklerinin kullanılarak koroner arter hastalığının varlığının belirlenmesi ve risk faktörlerinin kullanılmasıyla bir risk skor sisteminin oluşturulması
JALE BEKTAŞ
Doktora
İngilizce
2017
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÇukurova ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. TURGAY İBRİKÇİ
PROF. DR. İSMAİL TÜRKAY ÖZCAN
- A comparative study for football analytics with data mining and artificial intelligence techniques
Veri madenciliği ve yapay zeka teknikleri ile karşılaştırmalı futbol analitiği
MUSTAFA AADEL MASHJAL AL-ASADI
Doktora
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSelçuk ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. ŞAKİR TAŞDEMİR