Analysis of genetic data via data mining methods and its applications
Genetik verilerin veri madenciliği yöntemleri ile incelenmesi ve uygulamaları
- Tez No: 297910
- Danışmanlar: PROF. DR. EFENDİ NASİBOĞLU
- Tez Türü: Yüksek Lisans
- Konular: İstatistik, Statistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2011
- Dil: İngilizce
- Üniversite: Dokuz Eylül Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: İstatistik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 64
Özet
Özellikle ökaryotlarda gen yapılarının tahmin edilmesi biyoenformatiğin önemli konularından biridir. Gen yapılarının tahmin edilmesindeki en önemli konu kodlanan bölgelerdeki kesim bölgeleridir. Kesim bölgelerinin belirlenmesi de verilen DNA dizisindeki ekzonlar ve intronlar arasındaki bölgelerin doğru tanımlanmasına bağlıdır. Bu problem dizi elementlerinin `exon-intron' (EI), `intron-exon' (IE) or `None' (N) sınıfları olarak sınıflandırılması olarak tanımlanabilir.Bu tez çalışmasında, kesim bölgelerini belirlemek için geliştirilen yeni bir yöntem olan ve nükleotit baz frekanslarından oluşan spesifik pozisyonel skorlama matrisini kullanan Ağırlıklandırılmış Pozisyonel Skorlama Metodu (WPSSM) önerilmiştir. Ayrıca optimal ağırlıkların ve eşik değerinin belirlenmesinde genetik algoritma kullanılmıştır. Bu metod öğrenme, tanımlama ve geçerlilik aşamaları olmak üzere üç aşamadan oluşmaktadır. Önerilen WPSS metodu literatürdeki pek çok metodun performansıyla karşılaştırıldığında etkili sonuçlar vermiştir. Hesaplamalar, `UCI Repository of machine learning databases' veri tabanından alınan DNA dizileri üzerinde gerçekleştirilmiştir.
Özet (Çeviri)
The prediction of the complete structure of genes is one of the important tasks of bioinformatics, especially in eukaryotes. A crucial part in gene structure prediction is to determine the splice sites in the coding region. Identification of splice sites depends on the precise recognition of the boundaries between exons and introns of a given DNA sequence. This problem can be formulated as a classification of sequence elements into `exon-intron? (EI), `intron-exon? (IE) or `None? (N) boundary classes.In this thesis, we propose a new Weighted Position Specific Scoring Method (WPSSM) to recognize splice sites which uses a position-specific scoring matrix constructed by nucleotide base frequencies. A genetic algorithm is used in order to tune the weight and threshold parameters of the positions on. This method comprises of three phases: learning phase, identification phase and validation phase. In this study, the optimal position weights and threshold parameter are found via genetic algorithm. The proposed WPSS method poses efficient results compared to the performance of various methods proposed in the literature. Computational experiments are conducted on the DNA sequence dataset from `UCI Repository of machine learning databases?.
Benzer Tezler
- Finsentiment: Predicting financial sentiment and risk through transfer learning
Başlık çevirisi yok
ZEHRA ERVA ERGÜN
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÖzyeğin ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ EMRE SEFER
- Veri madenciliği teknikleri kullanılarak gen regülasyonunun incelenmesi
An investigation of gene regulation via data mining techniques
MEHMET CİHAN ŞAHİNGİL
Doktora
Türkçe
2019
Elektrik ve Elektronik MühendisliğiHacettepe ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ YAKUP SABRİ ÖZKAZANÇ
- Optimizasyon temelli öznitelik seçme yöntemleri ile desteklenen topluluk öğrenme yaklaşımına dayalı yazar tanıma
Author identification based on the ensemble learning approach supported by optimization-based feature selection methods
MERVE GÜLLÜ
Yüksek Lisans
Türkçe
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. HÜSEYİN POLAT
- Belge benzerliği sonuçlarının nsga-ıı ile çok amaçlı optimizasyonu
Multi-objective optimization of document similarity results with(via) nsga-ii
HÜSEYİN AHMETOĞLU
Yüksek Lisans
Türkçe
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolVan Yüzüncü Yıl ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. RIDVAN SARAÇOĞLU
- Farklı habitatlardan izole edilen aktinomiset genomlarında yeni ilaç adaylarının taranması
Mining of actinomycete genomes for the discovery of new natural products
SÜLEYMAN ÖZAKIN