Geri Dön

Employing data mining techniques on biological sequences for transcription factor binding site identification

Biyolojik dizilimler üzerinde veri madenciliği teknikleri kullanarak trankripsiyon faktörü bağlanma sitelerinin tespiti

  1. Tez No: 299421
  2. Yazar: MUSTAFA KARABULUT
  3. Danışmanlar: YRD. DOÇ. DR. TURGAY İBRİKÇİ
  4. Tez Türü: Doktora
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2011
  8. Dil: İngilizce
  9. Üniversite: Çukurova Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 92

Özet

Transkripsiyon faktörü bağlanma sitelerinin (TFBS) tanımlanması modern biyolojide genom fonksiyonları ve gen düzenleyici ağlarını çözümlenmesi doğrultusunda önemli bir süreçtir. Bu alanların tanımlanmasının bir yolu yoğun emek isteyen, zaman alıcı ve pahalı laboratuar deneyleridir. Bu deneylere alternatif olarak, TFBS alanlarının verilen DNA dizilimlerinden otomatik olarak çıkaran, desen tanıma temelli bilgisayar yöntemleri de ilgili literatürde bulunmaktadır.Bu çalışmada üç farklı hesapsal yöntem önerilmektedir. Önerilen birinci yaklaşım verilen tüm w-mer'leri kümeleme ve z-score testi kullanarak istatistiksel olarak ilginç bir yerel hizalama bulmaya çalışmaktadır. Dört kümeleme metodu bu bağlamda değerlendirilmiştir, bunlar: Self-organizing map, Fuzzy C-Means, K-means ve Expectation Maximization algoritmalarıdır. İkinci teknik ise birinci tekniğe oldukça benzemekle beraber, farklı olarak, pozisyon ağırlık matrislerinden oluşan yerel hizalamaları iyileştirmek için Bayes teoremi temelli kümeleme sonrası optimizasyon prosedürü içermektedir. Bu tezde geliştirilen üçüncü hesapsal teknik ise parçacık sürü optimizasyonu adlı bir stokastik arama prosedürünü benimsemektedir. Geliştirilen metotlar, ilgili literatüre yeni katkılar sağlamak amacıyla düşük ve yüksek canlı DNA'sı içeren pek çok veri seti kullanılarak değerlendirilmiştir. Dahası, literatürden MEME ve MDScan gibi gelişmiş metotlar da kıyaslanmışlardır. Deneysel sonuçlar önerilen metotların DNA motif-bulma işi için oldukça umut vaat edici olduğunu göstermiştir.

Özet (Çeviri)

Identification of transcription factor binding sites (TFBSs) is a significant task in contemporary biology towards deciphering the genome functions and understanding gene regulatory networks. One way to identify them is via laboratory experiments which are laborious, time consuming and costly. Alternatively, computational methods based on pattern recognition techniques are proposed in the literature for automatic extraction of TFBS instances from given DNA sequences.In this study, three different computational methods are proposed. First approach is based on clustering all w-mers and attempting to find a statistically interesting local alignment via z-score testing. Four clustering methods, Self-organizing map, Fuzzy C-Means, K-means and Expectation Maximization with Gaussian Mixture Models, are considered in this context. The second technique is similar to the first one except that it has a Bayesian post-optimization procedure to fine-tune local alignments composed of Position weight matrices. The third computational technique developed in the thesis adopts a different approach by utilizing a stochastic search procedure, namely Particle swarm optimization. The developed methods each of which offers novel contributions to the relevant literature are evaluated against several types of datasets including low and high organism DNA. Moreover, they are also compared to state-of-art motif-finding tools from the literature such as MEME and MDScan, as well. Experimental results suggest that the proposed methods are highly promising for DNA motif-finding task.

Benzer Tezler

  1. Large scale characterization of protein interactions: Identification of hot spots and spatial motifs in protein-protein interfaces

    Protein etkileşimlerinin geniş ölçekli nitelendirilmesi: Protein-protein arayüzlerindeki sıcak noktaların ve uzaysal desenlerin belirlenmesi

    EMRE GÜNEY

    Yüksek Lisans

    İngilizce

    İngilizce

    2007

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKoç Üniversitesi

    Elektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ATTİLA GÜRSOY

  2. Polianilin ve polidopamin kopolimerlerinin sentezi, PbI2 ile doplanması ve spektroskopik incelenmesi

    Synthesis of polyaniline and polydopamine copolymers, doping with PbI2 and spectroscopic investigation

    MERVE HERCAN MAMMAD

    Doktora

    Türkçe

    Türkçe

    2024

    Polimer Bilim ve TeknolojisiSakarya Üniversitesi

    Kimya Ana Bilim Dalı

    PROF. DR. MUSTAFA GÜLFEN

  3. Banka çağrı merkezinin bono satış verilerinin sınıflandırmaalgoritmaları ile analizi

    Analysis of bond sales data of the banking call centerby classification algorithms

    ERKAN ŞEKER

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    Maden Mühendisliği ve MadencilikBahçeşehir Üniversitesi

    Bilgi Teknolojileri Ana Bilim Dalı

    DOÇ. DR. YÜCEL BATU SALMAN

  4. Use of data mining techniques to determine presence of coronary artery disease and deriving a risk score by employing risk factors

    Veri madenciliği tekniklerinin kullanılarak koroner arter hastalığının varlığının belirlenmesi ve risk faktörlerinin kullanılmasıyla bir risk skor sisteminin oluşturulması

    JALE BEKTAŞ

    Doktora

    İngilizce

    İngilizce

    2017

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÇukurova Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. TURGAY İBRİKÇİ

    PROF. DR. İSMAİL TÜRKAY ÖZCAN

  5. A comparative study for football analytics with data mining and artificial intelligence techniques

    Veri madenciliği ve yapay zeka teknikleri ile karşılaştırmalı futbol analitiği

    MUSTAFA AADEL MASHJAL AL-ASADI

    Doktora

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSelçuk Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. ŞAKİR TAŞDEMİR