Application of feature selection method on phylogenetic tree construction using molecular and morphological data
Karakter seçimi metodunun moleküler ve morfolojik data kullanılarak filogenetik ağaç oluşturulmasında uygulanması
- Tez No: 338201
- Danışmanlar: PROF. DR. M. TEKİN BABAÇ, PROF. DR. O. UĞUR SEZERMAN
- Tez Türü: Doktora
- Konular: Biyoistatistik, Biyoloji, Biyomühendislik, Biostatistics, Biology, Bioengineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2013
- Dil: İngilizce
- Üniversite: Abant İzzet Baysal Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Biyoloji Bölümü
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 184
Özet
Bu tezde, Genetik Algoritmalar ? Karakter Seçimi metodu kullanılarak biyolojik veri öbegleri (morfolojik ve moleküler dizi) çözümlenmiştir. Verilerin bilgi içeriği araştırılmış ve tartışılmıştır. Bu tez, belirli bir veri öbeği içindeki uyum ve uyumsuzlukları incelemekle beraber özellikle taksonomik uygulamalarda istenen ağacı bulmak için en az kaç karakter kullanmalıdır veya veri kümesinin hangi kısmı nasıl bir bilgi içerir gibi soruların da cevaplarını aramaktadır.Bu çalışma iki kısımdan oluşmaktadır; morfolojik veri çözümlemesi ve moleküler dizi verisinin çözümlemesi. İlk kısımda, sayısal taksonomide referans noktası olarak da kabul edilen Hoplitis veri öbeğini ve daha önceki çalışmamda ortaya koymuş olduğum palamut veri öbeğinin çözümlemesini yaptım. Öne sürülen yöntem, Hoplitis veri öbeğini başarılı bir şekilde veri öbeğinin yazarlarının belirttiğine çok yakın olarak 67 karaktere eniyiledi. Palamut veri öbeğinin eniyilemesi ise kabul edilebilir derecede başarılı olarak mantıklı karakterlerle sonuçlandı.Bin nükleotide kadar olan daha kısa diziler aynı eniyileme algoritması kullanılarak çözümlendi. Heme Cupper Oxidase veri öbeği çözümlemesi sonucunda, önemli pozisyonlar çözüm kümelerindeki sıklıklarına göre belirlendi. Bu pozisyonlardan bazıları güncel çalışmalarla oldukça benzerlik gösterdi. Daha uzun diziler için, En Uzun Ortak Altdizi yöntemi kullanılarak benzer bir algoritma tasarlandı. Bu yöntemde tek fark, analizler karakterler ya da pozisyonlar yerine ortak bloklar tarafından ayrılan küçük altdiziler üzerinde gerçekleştirilmiştir. Bu kısımda iyi bilinen memeli mitokondri genom veri öbeği kullanıldı. Algoritma, aynı topolojiyi oluşturabilmek için, göreceli olarak oldukça küçük bir altdiziyi buldu.
Özet (Çeviri)
This thesis analyzes biological datasets in the form of (morphological data and molecular sequences data) by utilization of Genetic Algorithms as the Feature Selection method. Information contents of the datasets were investigated and discussed. The thesis also traced the congruencies and incongruences within the dataset and seek to answer questions such as what is the minimum number of characters required to reconstruct a desired tree, or which part of the dataset carries what type of information especially for taxonomic applications.This study is composed of two parts; analysis of morphological data and molecular sequence data. In the analysis of morphological data, I have analyzed a classical dataset based on Hoplitis taxa which can be accepted as a benchmark numerical taxonomy dataset and acorn dataset. The proposed method successfully optimized the Hoplitis dataset to a set of 67 characters which was very close to predictions of the authors of the dataset. Optimization of the acorn dataset was also quiet successful by returning reasonable characters.Shorter molecular sequences up to 1000 nt were also analyzed by the optimization algorithm. Heme Cupper Oxidase dataset were resulted with positions that are found within the solution subsets frequently. Some of those positions were highly accurate with the current literature. For the longer sequences, a similar algorithm has been designed by the use of Longest Common Substring method. In this method, only the difference is that analyses were performed on small subsets separated by common blocks rather than characters or residues. In this part, we have used a well-known mammalian mitochondrial genome dataset. The algorithm has returned a relatively small subset of data to construct the same phylogeny.
Benzer Tezler
- Predictive modelling of mechanical properties in flat steel manufacturing: A comparative analysis of feature selection methods of mechanical properties for cold rolled products
Yassı çelik üretiminde mekanik özelliklerin tahminsel modellemesi:Soğuk haddelenmıiş ürünler için mekanik özelliklerin özellik seçim yöntemlerinin karşılaştırılmalı analizi
DİDEM BAKİLER İLME
Yüksek Lisans
İngilizce
2024
Yönetim Bilişim SistemleriKadir Has ÜniversitesiYönetim Bilimleri Ana Bilim Dalı
DOÇ. DR. EMRULLAH FATİH YETKİN
- Türkçe metinlerde duygu analizi
Sentiment analysis in Turkish texts
CUMALİ TÜRKMENOĞLU
Yüksek Lisans
Türkçe
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. AHMET CÜNEYD TANTUĞ
- Makine görmesi tabanlı kalite kontrolü için özellik çıkarım yöntemlerinin geliştirilmesi
Development of new feature extraction method for machine vision based measurement and quality inspection in conveyed objects
BÜŞRA AKARSU
Yüksek Lisans
Türkçe
2018
Mekatronik MühendisliğiFırat ÜniversitesiMekatronik Ana Bilim Dalı
DOÇ. DR. KORAY ŞENER PARLAK
- Gen ifadesi verilerine çok kriterli karar verme yöntemlerinin uygulanması
Application of multiple criteria decision making methods to gene expression data
MERYEM GÜLŞAH PAMUK
Yüksek Lisans
Türkçe
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ İSMAİL ATACAK
- Sınıflandırma problemlerinde meta-sezgisel optimizasyon yöntemlerinin özellik seçimi ve ayrıklaştırma amacıyla kullanımı
Utilization of metaheuristic optimization methods for feature selection and discretization on classification problems
İSMAİL KOÇ
Yüksek Lisans
Türkçe
2016
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSelçuk ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. İSMAİL BABAOĞLU