Machine learning methods for promoter region prediction
Makine öğrenimi yöntemleri ile promoter bölgesi tahmini
- Tez No: 286261
- Danışmanlar: DOÇ. DR. TOLGA CAN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2011
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Bölümü
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 77
Özet
Promoter sekanslarını, promoter olmayan sekanslardan ayırma işlemi promoter sınıflandırma olarak adlandırılır. Promoter bölgeleri transkripsiyon başlangıç bölgelerinde yer alıp, bu bölgeleri tanımlamak, gen bilgilerini geliştirme ve transkripsiyon başlangıç bölgelerini tanımlama gibi birçok sebepten ötürü önemlidir.Bu çalışmada promoter bölgelerini sınıflandırmak için çeşitli yöntemler önerilmiştir. Bu metotlar ProK-means, ProSVM ve 3S1C olarak adlandırılır. ProSVM ve ProK-means algoritmalarında, promoter bölgelerini tanımlamak için sadece DNA'nın yapısal özellikleri kullanılmıştır. Elde edilen sonuçlar, diğer bir promoter tahmin yöntemi olan ProSOM ile karşılaştırılmıştır. ProSVM yönteminin, ProSOM yönteminden daha iyi sonuç verdiği gösterilmiştir.Daha sonra, 3S1C yöntemi tanıtılmıştır. Önerilen diğer promoter tahmin yöntemlerinden farkı, burada DNA'nın sinyal, içerik, yapı ve benzerlik özniteliklerinin hepsinin bir arada kullanılmasıdır. Ayrıca, promoter sınıflandırma yapan mevcut yöntemlere ek olarak bu çalışmada benzerlik özniteliği tanıtılmıştır. Benzerlik özniteliği, insan ve diğer türler arasındaki promoter bölgelerini karşılaştırır. Ayrıca benzerlik özniteliği, hata payını bir miktar azaltır. Promoter bölgelerini sınıflandırmak için ilk olarak sinyal, içerik, benzerlik ve yapı öznitelikleri çıkartılır. Sonra, bu öznitelikler destek vektör makineleri kullanılarak ayrı ayrı sınıflandırılır.Son adımda, çok katmanlı sinir ağları kullanarak sonuçlar birleştirilirip, sınıflandırma işlemi tamamlanır. 3S1C algoritma sonucunun umut verici olduğu görülmüştür.
Özet (Çeviri)
Promoter classification is the task of separating promoter from non promoter sequences. Determining promoter regions where the transcription initiation takes place is important for several reasons such as improving genome annotation and defining transcription start sites.In this study, various promoter prediction methods called ProK-means, ProSVM, and 3S1C are proposed.In ProSVM and ProK-means algorithms, structural features of DNA sequences are used to distinguish promoters from non promoters. Obtained results are compared with ProSOM which is an existing promoter prediction method. It is shown that ProSVM is able to achieve greater recall rate compared to ProSOM results.Another promoter prediction methods proposed in this study is 3S1C. The difference of the proposed technique from existing methods is using signal, similarity, structure, and context features of DNA sequences in an integrated way and a hierarchical manner.In addition to current methods related to promoter classification, the similarity feature, which compares the promoter regions between human and other species, is added to the proposed system. We show that the similarity feature improves the accuracy. To classify core promoter regions, firstly, signal, similarity, structure, and context features are extracted and then, these features are classified separately by using Support Vector Machines. Finally, output predictions are combined using multilayer perceptron. The result of 3S1C algorithm is very promising.
Benzer Tezler
- Variant pathogenicity prediction tool based on protein-protein interactions and the effects of variants on 3-dimensional protein structure:a model for monogenic autoinflammatory disorders
Protein protein etkileşimlerini ve varyantların 3 boyutlu protein yapısındaki etkilerini esas alan varyant patojenite tahmini
ABDULLAH ALPER BÜLBÜL
Yüksek Lisans
İngilizce
2021
Biyoistatistikİstanbul Teknik ÜniversitesiMoleküler Biyoloji-Genetik ve Biyoteknoloji Ana Bilim Dalı
PROF. DR. EDA TAHİR TURANLI
- Akış odaklı yerleşim yaklaşımı ve beyaz eşya sektöründeki bir işletmede uygulaması
Flow oriented layout approach and application in a white household company
TARIK BULUT
Yüksek Lisans
Türkçe
2019
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiMakine Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ RAMAZAN MURAT TABANLI
- A data adaptive categorical time series representation for supervised learning
Gözetimli öğrenme algoritmaları için yeni bir kategorik zaman serileri veri uyarlamalı temsili gösterimi
HANDE ÇAKIN
Yüksek Lisans
İngilizce
2016
Endüstri ve Endüstri MühendisliğiBoğaziçi ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. MUSTAFA GÖKÇE BAYDOĞAN
- Biyomedikal sinyallerde veri ön-işleme tekniklerinin medikal teşhiste sınıflama doğruluğuna etkisinin incelenmesi
The investigation of effect of data pre-processing techniques to classification accuracy on medical diagnosis in biomedical signals
KEMAL POLAT
Doktora
Türkçe
2008
Elektrik ve Elektronik MühendisliğiSelçuk ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. SALİH GÜNEŞ
- E-mobilite uygulamaları için lityum-iyon bataryaların fizik tabanlı modellerinin karşılaştırmalı analizi
Comparative analysis of physics-based models for lithium-ion batteries in e-mobility applications
HAKKI YAVUZ
Yüksek Lisans
İngilizce
2024
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektrik Mühendisliği Ana Bilim Dalı
DOÇ. DR. MEHMET ONUR GÜLBAHÇE