On clustering and classification methods in biosequence analysis
Biyosekans analizinde kümeleme ve sınıflandırma yöntemleri üzerine
- Tez No: 283672
- Danışmanlar: PROF. DR. EFENDİ NASİBOĞLU
- Tez Türü: Doktora
- Konular: Biyomühendislik, İstatistik, Bioengineering, Statistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2010
- Dil: İngilizce
- Üniversite: Dokuz Eylül Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: İstatistik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 112
Özet
İnsan genom çalışmaları çok fazla sayıda biyosekans verileri ortaya çıkarttığı için, bu verilerin işletim sürecinde maliyet ve zaman kaybını önleyen hesapsal teknikler geliştirilmektedir. Bu tezde, biyosekans analizinde ?protein, enzim sekansları- kümeleme ve sınıflama üzerine yeni yaklaşımlar çalışılmıştır.Sınıflandırma, bir uzman görüşü altında desen kümesine sınıf etiketleri atama ya da sınıflandırma yapmayı amaçlayan öğreticili bir öğrenme algoritmasıdır. Bu tezde, proteinlerin hücre içi yer tahmin etme problemi en uygun ağırlıklandırılmış bulanık k-NN (OWFKNN) kullanılarak çözülmüştür.Kümeleme, verilen elemanlar kümesini benzerlikleri temel alınarak kümelere ayırmayı amaçlayan denetimsiz öğrenme tekniğidir. Bu noktada, protein sekanslarının evrimsel ilişkilere sahip olmaları nedeniyle, bütün protein sekansları sekans benzerlikleri bakımından düzenlenebilmektedir. Filogenetik ağaç olarak adlandırılan grafiksel gösterim protein sekansları arasındaki ilişkiyi özetlemektedir. Filogenetik ağaç oluşturulması, bağlantı yöntemi olarak çok kriterli karar verme probleminde sıkça kullanılan Sıralı Ağırlıklı Ortalama (OWA) kullanılması önerilmiştir. OWA tabanlı hiyerarşik kümelemenin performansı ortalama karekök standart sapma (RMSSTD) ve R-kare (RS) küme geçerlilik indisleriyle incelenmiştir.
Özet (Çeviri)
Since human genome studies have brought out a huge number of biosequence data, computational techniques have been developed preventing the vast of cost and time in the management process of these data. In this thesis, new approaches on clustering and classification methods in biosequence ?protein, enzyme sequences? analysis are studied.Classification is a supervised learning algorithm that aims at categorizing or assigning class labels to a pattern set under the supervision of an expert. Therefore, the problem of subcellular location prediction of proteins has been solved by using Optimally Weighted Fuzzy k-NN (OWFKNN). In addition, enzymes have been classified by novel approaches based on minimum-distance classifiers.Clustering is an unsupervised learning technique that aims at decomposing a given set of elements into clusters based on similarity. In this point of view, due to the fact that protein sequences have evolutionary relationship, all protein sequences can be organized in terms of their sequence similarity. A graphical illustration called phylogenetic tree can summarize the relationship between the protein sequences. The construction of phylogenetic tree is based on hierarchical clustering. Thus, we have proposed Ordered Weighted Averaging (OWA) that is most commonly used in multicriteria decision-making, as a linkage method in construction phylogenetic tree. Performance of the OWA-based hierarchical clustering is analyzed by cluster validity indices Root-Mean-Square Standard Deviation (RMSSDT) and R-Squared (RS).
Benzer Tezler
- Makine öğrenmesi ile elde edilen statik sözlükleri kullanarak kısa metin sıkıştırma
Short text compression using static dictionaries obtained by machine learning
MURAT ASLANYÜREK
Doktora
Türkçe
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolTrakya ÜniversitesiHesaplamalı Bilimler Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ALTAN MESUT
- Retinal fundus görüntülerde piksel tabanlı sınıflandırma yöntemleri ile kan damarlarının çıkarılması
Extraction of blood vessels with pixel based classification methods in retinal fundus images
ZAFER YAVUZ
Doktora
Türkçe
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKaradeniz Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. CEMAL KÖSE
- Yapay sinir ağ modelleri ve sınıflandırmaya uygulanması
Neural network models and aplication to classification
NİDA GÖKÇE
Yüksek Lisans
Türkçe
2005
İstatistikMuğla Üniversitesiİstatistik ve Bilgisayar Bilimleri Ana Bilim Dalı
PROF.DR. MÜBARİZ EMİNOV
- BT görüntüleri üzerinden kalp odacıklarının bölütlenmesine yönelik alternatif bir yaklaşım
An alternative approach for the segmentation of the heart chambers from CT images
SERAP ERK
Yüksek Lisans
Türkçe
2015
Biyomühendislikİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. FATMA İNCİ ÇİLESİZ
PROF. DR. BÜLENT BAYRAM
- Veri sınıflandırması için matematiksel optimizasyon tabanlı metotlar
Methods based on mathematical optimization for data classification
NUR UYLAŞ SATI
Doktora
Türkçe
2013
Bilgi ve Belge YönetimiEge ÜniversitesiMatematik Ana Bilim Dalı
DOÇ. DR. BURAK ORDİN