Geri Dön

On clustering and classification methods in biosequence analysis

Biyosekans analizinde kümeleme ve sınıflandırma yöntemleri üzerine

  1. Tez No: 283672
  2. Yazar: ÇAĞIN KANDEMİR ÇAVAŞ
  3. Danışmanlar: PROF. DR. EFENDİ NASİBOĞLU
  4. Tez Türü: Doktora
  5. Konular: Biyomühendislik, İstatistik, Bioengineering, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2010
  8. Dil: İngilizce
  9. Üniversite: Dokuz Eylül Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 112

Özet

İnsan genom çalışmaları çok fazla sayıda biyosekans verileri ortaya çıkarttığı için, bu verilerin işletim sürecinde maliyet ve zaman kaybını önleyen hesapsal teknikler geliştirilmektedir. Bu tezde, biyosekans analizinde ?protein, enzim sekansları- kümeleme ve sınıflama üzerine yeni yaklaşımlar çalışılmıştır.Sınıflandırma, bir uzman görüşü altında desen kümesine sınıf etiketleri atama ya da sınıflandırma yapmayı amaçlayan öğreticili bir öğrenme algoritmasıdır. Bu tezde, proteinlerin hücre içi yer tahmin etme problemi en uygun ağırlıklandırılmış bulanık k-NN (OWFKNN) kullanılarak çözülmüştür.Kümeleme, verilen elemanlar kümesini benzerlikleri temel alınarak kümelere ayırmayı amaçlayan denetimsiz öğrenme tekniğidir. Bu noktada, protein sekanslarının evrimsel ilişkilere sahip olmaları nedeniyle, bütün protein sekansları sekans benzerlikleri bakımından düzenlenebilmektedir. Filogenetik ağaç olarak adlandırılan grafiksel gösterim protein sekansları arasındaki ilişkiyi özetlemektedir. Filogenetik ağaç oluşturulması, bağlantı yöntemi olarak çok kriterli karar verme probleminde sıkça kullanılan Sıralı Ağırlıklı Ortalama (OWA) kullanılması önerilmiştir. OWA tabanlı hiyerarşik kümelemenin performansı ortalama karekök standart sapma (RMSSTD) ve R-kare (RS) küme geçerlilik indisleriyle incelenmiştir.

Özet (Çeviri)

Since human genome studies have brought out a huge number of biosequence data, computational techniques have been developed preventing the vast of cost and time in the management process of these data. In this thesis, new approaches on clustering and classification methods in biosequence ?protein, enzyme sequences? analysis are studied.Classification is a supervised learning algorithm that aims at categorizing or assigning class labels to a pattern set under the supervision of an expert. Therefore, the problem of subcellular location prediction of proteins has been solved by using Optimally Weighted Fuzzy k-NN (OWFKNN). In addition, enzymes have been classified by novel approaches based on minimum-distance classifiers.Clustering is an unsupervised learning technique that aims at decomposing a given set of elements into clusters based on similarity. In this point of view, due to the fact that protein sequences have evolutionary relationship, all protein sequences can be organized in terms of their sequence similarity. A graphical illustration called phylogenetic tree can summarize the relationship between the protein sequences. The construction of phylogenetic tree is based on hierarchical clustering. Thus, we have proposed Ordered Weighted Averaging (OWA) that is most commonly used in multicriteria decision-making, as a linkage method in construction phylogenetic tree. Performance of the OWA-based hierarchical clustering is analyzed by cluster validity indices Root-Mean-Square Standard Deviation (RMSSDT) and R-Squared (RS).

Benzer Tezler

  1. Ordu ili (Türkiye) tatlısu Gammaridea (Crustacea, Amphipoda) faunası üzerine bir araştırma

    Study on freshwater Gammari̇dea (Crustacea, Amphipoda) fauna of Ordu (Turkey)

    MEHMET EKİNCİ

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    Balıkçılık TeknolojisiOrdu Üniversitesi

    Balıkçılık Teknolojisi Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. ALİ MİROĞLU

  2. Metil-sübstitüe metoksi konduritollerin sentezi

    Synthesis of methyl-substituted methoxy conduritols

    DİLEK KAPLAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    KimyaOrdu Üniversitesi

    Kimya Ana Bilim Dalı

    DOÇ. DR. LATİF KELEBEKLİ

  3. Enerji ihtiyacının karşılanmasında doğalgaz ve rüzgâr kaynaklı enerji çevrim santralleri; yatımlar üzerine stratejik bir analiz

    Natural gas and wind based cycle plant in supplying the needs of energy reguirement; a strategic analysis on investments

    GÜVEN KARAMAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    İşletmeOrdu Üniversitesi

    Yenilenebilir Enerji Ana Bilim Dalı

    YRD. DOÇ. DR. KADİR AKSAY

  4. Ordu ekolojik koşullarında bazı kuru fasulye (Phaseolus vulgaris L.) çeşit ve genotiplerinin verim, verim öğeleri ile tohum ve teknolojik özelliklerinin belirlenmesi

    Determination of yield and components with seed and technological characteristics of some dry beans (Phaseolus vulgaris L.) varieties and genotypes on in ecological conditions of Ordu

    YAŞAR ÖZBEKMEZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    ZiraatOrdu Üniversitesi

    Tarla Bitkileri Ana Bilim Dalı

    PROF. DR. NURİ YILMAZ

  5. Fındık zurufu kompostunun toprak kalitesi üzerine etkisi

    The effect of adding of hazelnut husk compost on soil quality

    SELAHATTİN AYGÜN

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    ZiraatOrdu Üniversitesi

    Toprak Bilimi ve Bitki Besleme Ana Bilim Dalı

    PROF. DR. TAYFUN AŞKIN