Geri Dön

On clustering and classification methods in biosequence analysis

Biyosekans analizinde kümeleme ve sınıflandırma yöntemleri üzerine

  1. Tez No: 283672
  2. Yazar: ÇAĞIN KANDEMİR ÇAVAŞ
  3. Danışmanlar: PROF. DR. EFENDİ NASİBOĞLU
  4. Tez Türü: Doktora
  5. Konular: Biyomühendislik, İstatistik, Bioengineering, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2010
  8. Dil: İngilizce
  9. Üniversite: Dokuz Eylül Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 112

Özet

İnsan genom çalışmaları çok fazla sayıda biyosekans verileri ortaya çıkarttığı için, bu verilerin işletim sürecinde maliyet ve zaman kaybını önleyen hesapsal teknikler geliştirilmektedir. Bu tezde, biyosekans analizinde ?protein, enzim sekansları- kümeleme ve sınıflama üzerine yeni yaklaşımlar çalışılmıştır.Sınıflandırma, bir uzman görüşü altında desen kümesine sınıf etiketleri atama ya da sınıflandırma yapmayı amaçlayan öğreticili bir öğrenme algoritmasıdır. Bu tezde, proteinlerin hücre içi yer tahmin etme problemi en uygun ağırlıklandırılmış bulanık k-NN (OWFKNN) kullanılarak çözülmüştür.Kümeleme, verilen elemanlar kümesini benzerlikleri temel alınarak kümelere ayırmayı amaçlayan denetimsiz öğrenme tekniğidir. Bu noktada, protein sekanslarının evrimsel ilişkilere sahip olmaları nedeniyle, bütün protein sekansları sekans benzerlikleri bakımından düzenlenebilmektedir. Filogenetik ağaç olarak adlandırılan grafiksel gösterim protein sekansları arasındaki ilişkiyi özetlemektedir. Filogenetik ağaç oluşturulması, bağlantı yöntemi olarak çok kriterli karar verme probleminde sıkça kullanılan Sıralı Ağırlıklı Ortalama (OWA) kullanılması önerilmiştir. OWA tabanlı hiyerarşik kümelemenin performansı ortalama karekök standart sapma (RMSSTD) ve R-kare (RS) küme geçerlilik indisleriyle incelenmiştir.

Özet (Çeviri)

Since human genome studies have brought out a huge number of biosequence data, computational techniques have been developed preventing the vast of cost and time in the management process of these data. In this thesis, new approaches on clustering and classification methods in biosequence ?protein, enzyme sequences? analysis are studied.Classification is a supervised learning algorithm that aims at categorizing or assigning class labels to a pattern set under the supervision of an expert. Therefore, the problem of subcellular location prediction of proteins has been solved by using Optimally Weighted Fuzzy k-NN (OWFKNN). In addition, enzymes have been classified by novel approaches based on minimum-distance classifiers.Clustering is an unsupervised learning technique that aims at decomposing a given set of elements into clusters based on similarity. In this point of view, due to the fact that protein sequences have evolutionary relationship, all protein sequences can be organized in terms of their sequence similarity. A graphical illustration called phylogenetic tree can summarize the relationship between the protein sequences. The construction of phylogenetic tree is based on hierarchical clustering. Thus, we have proposed Ordered Weighted Averaging (OWA) that is most commonly used in multicriteria decision-making, as a linkage method in construction phylogenetic tree. Performance of the OWA-based hierarchical clustering is analyzed by cluster validity indices Root-Mean-Square Standard Deviation (RMSSDT) and R-Squared (RS).

Benzer Tezler

  1. Makine öğrenmesi ile elde edilen statik sözlükleri kullanarak kısa metin sıkıştırma

    Short text compression using static dictionaries obtained by machine learning

    MURAT ASLANYÜREK

    Doktora

    Türkçe

    Türkçe

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolTrakya Üniversitesi

    Hesaplamalı Bilimler Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ALTAN MESUT

  2. Retinal fundus görüntülerde piksel tabanlı sınıflandırma yöntemleri ile kan damarlarının çıkarılması

    Extraction of blood vessels with pixel based classification methods in retinal fundus images

    ZAFER YAVUZ

    Doktora

    Türkçe

    Türkçe

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKaradeniz Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. CEMAL KÖSE

  3. Yapay sinir ağ modelleri ve sınıflandırmaya uygulanması

    Neural network models and aplication to classification

    NİDA GÖKÇE

    Yüksek Lisans

    Türkçe

    Türkçe

    2005

    İstatistikMuğla Üniversitesi

    İstatistik ve Bilgisayar Bilimleri Ana Bilim Dalı

    PROF.DR. MÜBARİZ EMİNOV

  4. BT görüntüleri üzerinden kalp odacıklarının bölütlenmesine yönelik alternatif bir yaklaşım

    An alternative approach for the segmentation of the heart chambers from CT images

    SERAP ERK

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    Biyomühendislikİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    PROF. DR. FATMA İNCİ ÇİLESİZ

    PROF. DR. BÜLENT BAYRAM

  5. Veri sınıflandırması için matematiksel optimizasyon tabanlı metotlar

    Methods based on mathematical optimization for data classification

    NUR UYLAŞ SATI

    Doktora

    Türkçe

    Türkçe

    2013

    Bilgi ve Belge YönetimiEge Üniversitesi

    Matematik Ana Bilim Dalı

    DOÇ. DR. BURAK ORDİN