Geri Dön

Biyoinformatik veri sınıflandırma problemleri için boyut indirgemeye dayalı öznitelik seçimi yaklaşımlarının geliştirilmesi

Developing dimensionality reduction based feature selection approaches for bioinformatic data classification problems

  1. Tez No: 535653
  2. Yazar: UMAY GÜLFEM ELGÜN
  3. Danışmanlar: DR. ÖĞR. ÜYESİ ÖZKAN UFUK NALBANTOĞLU
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Öznitelik seçimi, veri sınıflandırma, boyut indirgeme, yüksek boyutlu veri, Feature selection, data classification, dimensionality reduction, high- dimentional data
  7. Yıl: 2019
  8. Dil: Türkçe
  9. Üniversite: Erciyes Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 104

Özet

Öznitelik Seçimi (ÖS), makine öğrenme, veri madenciliği ve biyoinformatik gibi alanlarda, verilerin boyutsallığını azaltmak ve sınıflandırma algoritması gibi bir algoritmanın performansını artırmak için kullanılmaktadır. ÖS teknikleri, artan veri boyutlarından dolayı, birçok alandaki uygulamalarda belirgin bir ihtiyaç haline gelmiştir. Bu tezde, yüksek boyutluluğun getirdiği, boyutsallık laneti, aşırı öğrenme gibi sorunlardan; ÖS için sıklıkla kullanılan yaklaşımlardan ve her birinin avantaj ve dezavantajlarından bahsedilmektedir. Ayrıca, ÖS uygulamalarında sıkça rastlanan sorunlar için geliştirilecek olan teorik çözüm anlatılmaktadır. Asıl özellik uzayındaki verilerin daha düşük boyutlu bir uzaya taşınıp, ÖS'nin bu uzayda yapılması ve bu daha düşük boyutlu uzayda seçilen aşırı öğrenmeye dayanıklı özelliklerin, asıl uzaya geri yansıtılmasıyla oluşan sonuçlar incelenmiştir.

Özet (Çeviri)

Feature selection (FS) is used in areas such as machine learning, data mining and bioinformatics to reduce the dimensionality of data and increase the performance of an algorithm such as a classification algorithm. FS techniques have become an apparent need in many applications because of the growing data size. In this paper, high-dimensionality problems, such as the curse of dimensionality and overfitting are considered. FS approaches that commonly used are explained and their advantages and disadvantages are discussed. It also proposes a theoretical solution for frequently encountered problems in FS applications. Datas harboring in a feature space are transformed to a lower dimensional space and features are selected in that space. This overfitting robust features are reconstructed to the primary space and are observed as the result of that process.

Benzer Tezler

  1. Localized multiple kernel algorithms for machine learning

    Yapay öğrenme için yerel çoklu çekirdek algoritmaları

    MEHMET GÖNEN

    Doktora

    İngilizce

    İngilizce

    2010

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. ETHEM ALPAYDIN

  2. Determining novel target genes in WNT/𝛽-catenin signaling pathway using machine learning

    WNT/beta-catenin sinyal yolağında makine öğrenmesi ile hedef genler belirlenmesi

    CEMRE KEFELİ

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Genetikİstanbul Üniversitesi

    Moleküler Biyoloji ve Genetik Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ANDRES OCTAVIO ARAVENA DUARTE

  3. A mathematical contribution of statistical learning and continuous optimization using infinite and semi-infinite programming to computational statistics

    İstatistiksel öğrenme ve sürekli optimizasyon yöntemlerinıin sonsuz ve yarı sonsuz programlama kullanılarak hesaplamalı istatistiğe uygulanması

    SÜREYYA ÖZÖĞÜR AKYÜZ

    Doktora

    İngilizce

    İngilizce

    2009

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Bilimsel Hesaplama Ana Bilim Dalı

    PROF. DR. GERHARD WİLHELM WEBER

    PROF. DR. JOHN SHAWE TAYLOR

  4. Predicting multiple types of biological relationships with integrative non-negative matrix factorization

    Bütüncül negatif olmayan matris faktörizasyonu ile çoklu biyolojik ilişki türlerinin öngörülmesi

    ONUR SAVAŞ KARTLI

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    BiyoistatistikOrta Doğu Teknik Üniversitesi

    Biyoenformatik Ana Bilim Dalı

    DOÇ. DR. YEŞİM AYDIN SON

    DOÇ. DR. TUNCA DOĞAN

  5. Bitki transkripsiyon faktörlerinin hibrit derin öğrenme ile sınıflandırılması

    Classification of plant transcription factors by hybrid deep learning

    ALİ BURAK ÖNCÜL

    Doktora

    Türkçe

    Türkçe

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKarabük Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ YÜKSEL ÇELİK