Geri Dön

İkili kümeleme algoritmalarının görsel ve sayısal açıdan karşılaştırılması

Visual and numerical comparison of biclustering algorithms

  1. Tez No: 493662
  2. Yazar: AHMET KOCATÜRK
  3. Danışmanlar: DOÇ. DR. BÜLENT ALTUNKAYNAK
  4. Tez Türü: Yüksek Lisans
  5. Konular: İstatistik, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2018
  8. Dil: Türkçe
  9. Üniversite: Gazi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 98

Özet

Gen açıklama verilerinde benzer ifade yapılarına göre gen gruplarını belirlemek oldukça önemlidir. Bu veriler için yapılacak kümeleme analizlerinde son zamanlarda popüler olan ikili kümeleme yöntemleri kullanılmaktadır. İkili kümeleme yöntemlerinde farklı gen açıklama veri yapıları için çok sayıda algoritma önerilmiştir. Araştırmanın amacına göre elde edilecek ikili kümelerin etkinliğini ölçmek için bu algoritmaların performanslarına bakılması gerekir. Bu çalışmada en yaygın olarak kullanılan CC, Bimax, Plaid, Spectral, Quest ve Xmotif algoritmalarının performansları görsel ve sayısal olarak karşılaştırılmıştır. Bu algoritmaların görsel karşılaştırmasında ikili kümelerin ısı grafiklerine bakılmıştır. Sayısal karşılaştırılmasında ise varyans ölçüsü (VAR), ortalama karesel artık skoru (MSR), uygunluk indeksi (UI), ölçeklenen ortalama karesel artık skoru (SMSR), Chia ve Karuturi ikili küme skoru (CKSB), ortalama korelasyon ölçüsü (ACV), alt matris korelasyon ölçüsü (SCS), ortalama Spearman korelasyon değeri (ASR), Spearman ikili küme ölçüsü (SBM) ve sanal hata (VE) ikili küme değerlendirme ölçüleri hesaplanmıştır. Değerlendirme ölçüleri hesaplaması R fonksiyonları ile oluşturulmuş ve analizler bu kodlara uygulanarak gerçekleşmiştir. Farklı veri yapılarında karşılaştırma yapmak için yapay ve gerçek veriler kullanılmıştır. Yapay veri seti uygulamasında dört farklı senaryo ile ikili kümeler oluşturulmuştur. Bunlar ikili kümeler arasında örtüşme ve aykırı değerlerin olup olmadığı durumlardır. Gerçek veri seti uygulamasında ise maya verisi, lenf hücrelerinin gen ifadesini içeren insan verisi ve protein-protein etkileşim skorlarını içeren fare verisi kullanılmıştır. Yapılan analizler sonucunda hangi algoritmanın hangi veri setinde daha anlamlı ikili kümeler elde ettiği belirlenmiştir.

Özet (Çeviri)

It is very important to identify gene groups according to similar expressions in gene expression data. Biclustering methods, which are popular recently, are used in the clustering analysis for this data. Numerous algorithms have been proposed for different gene expression data structures in biclustering methods. The performance of these algorithms needs to be examined in order to measure the effectiveness of the biclusters obtained for the purpose of the study. In this study, the performances of the most commonly used CC, Bimax, Plaid, Spectral, Quest and Xmotif algorithms are visually and numerically compared. In the visual comparison of these algorithms, the heatmaps of biclusters are looked at. In numerical comparison, variance measure (VAR), mean squared residual score (MSR), fitness index (UI), scaled mean squared residual score (SMSR), Chia and Karuturi bicluster score (CKSB), average correlation measure (SPS), Spearman correlation coefficient (ASR), Spearman bicluster measure (SBM), and virtual error (VE) bicluster evaluation measures were calculated. Calculation of evaluation measures was made with R functions and analyzes were applied to these codes. Artificial and real data are used to compare different data structures. In the application of artificial data set, biclusters were formed with four different scenarios. These are cases where there is overlap between the biclusters and whether there are outliers. In the real data set, yeast, human data containing the gene expression of lymphoma cells and mouse data containing proteinprotein interaction scores were used. As a result of the analysis, it was determined which algorithm obtained more meaningful biclusters in which data set.

Benzer Tezler

  1. Change detection in multitemporal satellite images using multiscale bilateral filter and sift flow

    Çoklu zamanlı uydu görüntülerinde çoklu ölçekli bileteral süzgeç ve sıft akışı ile değişiklik tespiti

    BAHAA AWAD

    Yüksek Lisans

    İngilizce

    İngilizce

    2018

    Mühendislik Bilimleriİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    DOÇ. DR. IŞIN YAZGAN ERER

  2. Content based user preference modeling for image recommender systems

    Resim önerisi sistemleri için içerik tabanlı kullanıcı tercihleri modelleme

    HARUN IŞIK

    Yüksek Lisans

    İngilizce

    İngilizce

    2015

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBahçeşehir Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. KEMAL EGEMEN ÖZDEN

  3. Comparing biclustering algorithms using data envelopment analysis to choose the best parameters

    İkili kümeleme algoritmalarının karşılaştırılmasında ve parametrelerinin seçiminde veri zarflama analizinin kullanımı

    AMMAR HOMAIDA

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    İstatistikGazi Üniversitesi

    İstatistik Ana Bilim Dalı

    DOÇ. DR. BÜLENT ALTUNKAYNAK

  4. Bayes ve bazı ikili kümeleme algoritmalarının zootekni verilerinde kullanımı

    Usage of bayesian and some biclustering algorithms in animal science data

    LÜTFİ BAYYURT

    Doktora

    Türkçe

    Türkçe

    2022

    BiyoistatistikOndokuz Mayıs Üniversitesi

    Zootekni Ana Bilim Dalı

    PROF. DR. HASAN ÖNDER

  5. Ağ bağlantılı veriler için gözetimsiz ikili öznitelik oluşturma yöntemi

    Unsupervised binary feature construction method for networked data

    ARZU KAKIŞIM

    Doktora

    Türkçe

    Türkçe

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGebze Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. İBRAHİM SOĞUKPINAR