Geri Dön

Biyoinformatikte çok boyutlu verilerin boyut indirgenerek sınıflandırılması

Classification by dimension reduction of multidimensional data sets in bioinformatics

  1. Tez No: 395786
  2. Yazar: HATİCE ZEHRA DEMİRCİOĞLU
  3. Danışmanlar: DOÇ. DR. HASAN ŞAKİR BİLGE
  4. Tez Türü: Yüksek Lisans
  5. Konular: Biyomühendislik, Biyoteknoloji, Bioengineering, Biotechnology
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2015
  8. Dil: Türkçe
  9. Üniversite: Gazi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 69

Özet

Günümüzde biyoinformatik alanda devasa boyuttaki verileri veri madenciliği yöntemleri kullanarak işlemek büyük önem kazanmaktadır. Mikrodizi teknolojisi ile elde edilen gen ifade verileri üzerinde çeşitli boyut indirgeme ve öznitelik seçme yöntemleri kullanılarak hastalığa neden olan genlerin tespit edilmesi biyoinformatik alanda önemli bir yel almaktadır. Bu çalışmada, mikrodizi teknolojisinden elde edilen yumurtalık kanseri gen ifade veri kümesi üzerinde öznitelik seçme yöntemlerinden ve boyut indirgeme yöntemlerinden bazıları kullanılarak veri kümesi küçültülerek çeşitli sınıflandırma yöntemleri ile başarıları ölçülerek yumurtalık kanseri olan hastalarda hangi genlerin daha önemli olduğuna karar verilmeye çalışılmıştır. Öznitelik seçme yöntemlerinden Fisher Korelasyon Skorlama ve Weltch-T İstatistiği yöntemleri kullanılarak veri setindeki gen öznitelik sayısı bine indirgenerek, ilk 100 gen içinde sınıflandırma başarıları bulunmuştur. Çeşitli sınıflandırıcı başarımları arasında destek vektör makineleri(lineer çekirdek fonksiyonu) sınıflandırıcısı ile %100 başarı elde edilmiştir.

Özet (Çeviri)

Nowadays, Processing the big data in bioinformatics area by using data mining techniques have gained importance. Identifying genes that cause disease by using various size reduction and feature selection methods on gene expression data obtained by microarray technology is an significant role in bioinformatics. Obtained from those methods, size reducted data set measured with various methods of classification performance has been studied which genes are more important in patients with ovarian cancer.Using feature selection methods with the Fisher Correlation Score method and Weltch-T statistic method reduced the number of thousand features, classification successes were found for the first100 genes fetures in the data set. Among the various classifiers successes, support vector machine(linear kernel function) classifier were obtained with a 100% success.

Benzer Tezler

  1. Comparison of data reduction algorithms for biomedical applications

    Biyomedikal uygulamalar için veri azaltılması algoritmalarının karşılaştırılması

    THIBAUT JUDICAEL BAH

    Yüksek Lisans

    İngilizce

    İngilizce

    2015

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSelçuk Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. BEKİR KARLIK

  2. Development of visual analysis interfaces for large biological data and characterization of immunomodulatory noncoding RNA networks cancer

    Büyük biyolojik veriler için görsel analiz arayüzlerinin geliştirilmesi ve kanserde immünomodülatör kodlamayan RNA ağlarının karakterizasyonu

    MUHAMMET EMRE KUŞ

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Biyolojiİzmir Yüksek Teknoloji Enstitüsü

    Moleküler Biyoloji ve Genetik Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ HÜSEYİN ATAKAN EKİZ

  3. İnsan genomundaki kopya sayısı değişikliklerinin snp-array yöntemi kullanılarak incelenmesi ve tespit edilen değişikliklerin validasyonu

    Copy number variation detection in the human genome with using snp array method and validation of detected variations

    FATMA YEŞİM KESİM

    Yüksek Lisans

    Türkçe

    Türkçe

    2014

    Genetikİstanbul Üniversitesi

    Genetik Ana Bilim Dalı

    DOÇ. DR. SİBEL AYLİN UĞUR İŞERİ

  4. Gen açıklama verilerinin sınıflandırılmasında yeni bir özellik seçimi yöntemi

    A novel feature selection method for classification of gene expression data

    DERYA TURFAN

    Doktora

    Türkçe

    Türkçe

    2020

    BiyoistatistikHacettepe Üniversitesi

    İstatistik Ana Bilim Dalı

    PROF. DR. MURTAZA ÖZGÜR YENİAY

  5. TCGAnalyzeR: A web portal for visualization of pan-cancer molecular patient data

    TCGAnalyzeR: Pan-kanser moleküler hasta verilerinin görüntülenmesi için bir web portalı geliştirilmesi

    BAŞAK ABAK

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMuğla Sıtkı Koçman Üniversitesi

    Biyoinformatik Ana Bilim Dalı (Disiplinlerarası)

    DR. ÖĞR. ÜYESİ TUĞBA SÜZEK