Geri Dön

Feature subset selection problem on microarray data

Microarray verisinde özellik altkümesi seçimi problemi

  1. Tez No: 245417
  2. Yazar: NİHAN ÖZŞAMLI
  3. Danışmanlar: DOÇ. DR. UĞUR OSMAN SEZERMAN, YRD. DOÇ. DR. KEMAL KILIÇ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Endüstri ve Endüstri Mühendisliği, Industrial and Industrial Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2009
  8. Dil: İngilizce
  9. Üniversite: Sabancı Üniversitesi
  10. Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Endüstri Mühendisliği Bölümü
  12. Bilim Dalı: Endüstri Mühendisliği Ana Bilim Dalı
  13. Sayfa Sayısı: 90

Özet

Teknolojideki son gelişmeler, mikroarray çipleri gibi araçların ortaya çıkmasına önayak olmuştur. Mikroarray çipleri sayesinde bilim insanları, hücredeki genlerden ne kadar miktarda protein üretildiğini ölçme imkanı bulmuşlardır, ölçülen veriler gen ifade verisi olarak adlandırılmaktadır. Gen ifade verisi kullanılarak hücre örneklerinin sınıflandırılması, güncel bir araştırma konusudur. Bu alanda kullanılan veri, çok büyük ölçeklidir; bu nedenle özellikler ?genler- sınıflandırma için gerekli ve yeterli sayıya düşürülmelidir. Bu bağlamda, mikroarray gen ifade verileri üzerinde yapılan hücre sınıflandırması çalışmaları özünde bir ?özellik altkümesi seçimi? problemi barındırmaktadır. Yapılan çalışmanın amacı, kanserli ve sağlıklı hücre örneklerini, en az sayıda özelliği ?geni- kullanarak, başarılı bir şeklide sınıflandırabilecek bir araç geliştirmektir. Çalışmada iki yeni algoritma geliştirilmiştir. Birincisi, verinin bulanık kümelendirilmesinin ardından, bulanık kümelerin oluşturduğu yeni veride yüksek güvenilirlikli EĞER-İSE kurallarını tümünü arama yaklaşımıyla keşfeden bir algoritmadır. İkincisi ise, birincinin prensipleriyle, veri üzerinde, tümünü arama yönteminden ziyade, ışın arama algoritması ile kural keşfeden bir algoritmadır. Son algoritma ise özelliklerin ?genlerin- taşıdığı hiyerarşik yapıdaki bilgiye odaklanmaktadır. Bu hedefle karar ağaçları oluşturmada farklı başarı ölçütleri kullanılmıştır. Lösemi veri kümesinde başarılı sonuçlar elde edilmiş, karar ağacı temelli algoritmada ise kolon kanseri veri kümesi ile başarılı sonuçlara ulaşılmıştır.

Özet (Çeviri)

Recent advance of technology gave birth to tools such as microarray chips. The use of microarray chips enabled the scientists to measure the amount of protein production from their genes in a cell, known as the gene expression data. The classification of cell samples by means of their gene expression data is a hot research area. The data used for the analysis is massive and therefore the features, i.e., the genes, must be reduced to a reasonable level due to the computational cost of experiments and the possibility of misleading irrelevant genes. Therefore, usually, the analysis based on the classification of cell samples includes a feature subset selection phase. This thesis aims to develop a tool that can be used during the feature subset selection phase of such analyses. Three novel algorithms are proposed for the gene selection problem based on basic association rule mining. The first algorithm starts with fuzzy partitioning of the gene expression data and discovers highly confident IF-THEN rules that enable the classification of sample tissues. The second algorithm search the possible IF-THEN rules based on a heuristic pruning approach which is based on the beam search algorithm. Finally, the third algorithm focuses on the hierarchical information carried through gene expressions by constructing decision trees based on different performance measures. We found satisfactory results in Leukemia Dataset. In addition, in colon cancer dataset, algorithm that is based on construction of decision trees showed good performance.

Benzer Tezler

  1. Meta-analysis of microRNA and gene selection using machine learning

    Makine öğrenmesi kullanarak microRNA meta-analizi ve gen seçimi

    ELNAZ PASHAEI

    Doktora

    İngilizce

    İngilizce

    2017

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. NİZAMETTİN AYDIN

  2. Investigating the effect of different feature selection strategies for classification of gene expression signatures of tumor cells

    Tümör hücrelerin gen ifade imzalarinin siniflandirilmasina ilişkin farkli özellik seçim stratejilerinin etkisinin incelenmesi

    ABUBAKHARI SSERWADDA

    Yüksek Lisans

    İngilizce

    İngilizce

    2017

    Biyoistatistikİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. YUSUF YASLAN

  3. Feature weighting algorithm for decision support system of innovation policies

    İnovasyon politikaları karar destek sistemi için öznitelik ağırlıklandırılması

    CANER HAMARAT

    Yüksek Lisans

    İngilizce

    İngilizce

    2009

    Endüstri ve Endüstri MühendisliğiSabancı Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. KEMAL KILIÇ

  4. Better methods for configuring case-based reasoning systems

    Durum tabanlı muhakeme sistemleri için daha iyi yapılandırma yöntemleri

    EKREM KOCAGÜNELİ

    Yüksek Lisans

    İngilizce

    İngilizce

    2009

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. AYŞE BAŞAR BENER

  5. Application of metaheuristics for the feature selection problem

    Metasezgisellerin özellik seçimi problemi için uygulanması

    GÜLŞAH KALAYCI

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMarmara Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ALİ FUAT ALKAYA