Geri Dön

Machine learning methods for promoter region prediction

Makine öğrenimi yöntemleri ile promoter bölgesi tahmini

  1. Tez No: 286261
  2. Yazar: HİLAL ARSLAN
  3. Danışmanlar: DOÇ. DR. TOLGA CAN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2011
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Bölümü
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 77

Özet

Promoter sekanslarını, promoter olmayan sekanslardan ayırma işlemi promoter sınıflandırma olarak adlandırılır. Promoter bölgeleri transkripsiyon başlangıç bölgelerinde yer alıp, bu bölgeleri tanımlamak, gen bilgilerini geliştirme ve transkripsiyon başlangıç bölgelerini tanımlama gibi birçok sebepten ötürü önemlidir.Bu çalışmada promoter bölgelerini sınıflandırmak için çeşitli yöntemler önerilmiştir. Bu metotlar ProK-means, ProSVM ve 3S1C olarak adlandırılır. ProSVM ve ProK-means algoritmalarında, promoter bölgelerini tanımlamak için sadece DNA'nın yapısal özellikleri kullanılmıştır. Elde edilen sonuçlar, diğer bir promoter tahmin yöntemi olan ProSOM ile karşılaştırılmıştır. ProSVM yönteminin, ProSOM yönteminden daha iyi sonuç verdiği gösterilmiştir.Daha sonra, 3S1C yöntemi tanıtılmıştır. Önerilen diğer promoter tahmin yöntemlerinden farkı, burada DNA'nın sinyal, içerik, yapı ve benzerlik özniteliklerinin hepsinin bir arada kullanılmasıdır. Ayrıca, promoter sınıflandırma yapan mevcut yöntemlere ek olarak bu çalışmada benzerlik özniteliği tanıtılmıştır. Benzerlik özniteliği, insan ve diğer türler arasındaki promoter bölgelerini karşılaştırır. Ayrıca benzerlik özniteliği, hata payını bir miktar azaltır. Promoter bölgelerini sınıflandırmak için ilk olarak sinyal, içerik, benzerlik ve yapı öznitelikleri çıkartılır. Sonra, bu öznitelikler destek vektör makineleri kullanılarak ayrı ayrı sınıflandırılır.Son adımda, çok katmanlı sinir ağları kullanarak sonuçlar birleştirilirip, sınıflandırma işlemi tamamlanır. 3S1C algoritma sonucunun umut verici olduğu görülmüştür.

Özet (Çeviri)

Promoter classification is the task of separating promoter from non promoter sequences. Determining promoter regions where the transcription initiation takes place is important for several reasons such as improving genome annotation and defining transcription start sites.In this study, various promoter prediction methods called ProK-means, ProSVM, and 3S1C are proposed.In ProSVM and ProK-means algorithms, structural features of DNA sequences are used to distinguish promoters from non promoters. Obtained results are compared with ProSOM which is an existing promoter prediction method. It is shown that ProSVM is able to achieve greater recall rate compared to ProSOM results.Another promoter prediction methods proposed in this study is 3S1C. The difference of the proposed technique from existing methods is using signal, similarity, structure, and context features of DNA sequences in an integrated way and a hierarchical manner.In addition to current methods related to promoter classification, the similarity feature, which compares the promoter regions between human and other species, is added to the proposed system. We show that the similarity feature improves the accuracy. To classify core promoter regions, firstly, signal, similarity, structure, and context features are extracted and then, these features are classified separately by using Support Vector Machines. Finally, output predictions are combined using multilayer perceptron. The result of 3S1C algorithm is very promising.

Benzer Tezler

  1. Variant pathogenicity prediction tool based on protein-protein interactions and the effects of variants on 3-dimensional protein structure:a model for monogenic autoinflammatory disorders

    Protein protein etkileşimlerini ve varyantların 3 boyutlu protein yapısındaki etkilerini esas alan varyant patojenite tahmini

    ABDULLAH ALPER BÜLBÜL

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    Biyoistatistikİstanbul Teknik Üniversitesi

    Moleküler Biyoloji-Genetik ve Biyoteknoloji Ana Bilim Dalı

    PROF. DR. EDA TAHİR TURANLI

  2. Akış odaklı yerleşim yaklaşımı ve beyaz eşya sektöründeki bir işletmede uygulaması

    Flow oriented layout approach and application in a white household company

    TARIK BULUT

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Makine Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ RAMAZAN MURAT TABANLI

  3. A data adaptive categorical time series representation for supervised learning

    Gözetimli öğrenme algoritmaları için yeni bir kategorik zaman serileri veri uyarlamalı temsili gösterimi

    HANDE ÇAKIN

    Yüksek Lisans

    İngilizce

    İngilizce

    2016

    Endüstri ve Endüstri MühendisliğiBoğaziçi Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. MUSTAFA GÖKÇE BAYDOĞAN

  4. Biyomedikal sinyallerde veri ön-işleme tekniklerinin medikal teşhiste sınıflama doğruluğuna etkisinin incelenmesi

    The investigation of effect of data pre-processing techniques to classification accuracy on medical diagnosis in biomedical signals

    KEMAL POLAT

    Doktora

    Türkçe

    Türkçe

    2008

    Elektrik ve Elektronik MühendisliğiSelçuk Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. SALİH GÜNEŞ

  5. E-mobilite uygulamaları için lityum-iyon bataryaların fizik tabanlı modellerinin karşılaştırmalı analizi

    Comparative analysis of physics-based models for lithium-ion batteries in e-mobility applications

    HAKKI YAVUZ

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektrik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. MEHMET ONUR GÜLBAHÇE