Biyoinformatik veri sınıflandırma problemleri için boyut indirgemeye dayalı öznitelik seçimi yaklaşımlarının geliştirilmesi
Developing dimensionality reduction based feature selection approaches for bioinformatic data classification problems
- Tez No: 535653
- Danışmanlar: DR. ÖĞR. ÜYESİ ÖZKAN UFUK NALBANTOĞLU
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Öznitelik seçimi, veri sınıflandırma, boyut indirgeme, yüksek boyutlu veri, Feature selection, data classification, dimensionality reduction, high- dimentional data
- Yıl: 2019
- Dil: Türkçe
- Üniversite: Erciyes Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 104
Özet
Öznitelik Seçimi (ÖS), makine öğrenme, veri madenciliği ve biyoinformatik gibi alanlarda, verilerin boyutsallığını azaltmak ve sınıflandırma algoritması gibi bir algoritmanın performansını artırmak için kullanılmaktadır. ÖS teknikleri, artan veri boyutlarından dolayı, birçok alandaki uygulamalarda belirgin bir ihtiyaç haline gelmiştir. Bu tezde, yüksek boyutluluğun getirdiği, boyutsallık laneti, aşırı öğrenme gibi sorunlardan; ÖS için sıklıkla kullanılan yaklaşımlardan ve her birinin avantaj ve dezavantajlarından bahsedilmektedir. Ayrıca, ÖS uygulamalarında sıkça rastlanan sorunlar için geliştirilecek olan teorik çözüm anlatılmaktadır. Asıl özellik uzayındaki verilerin daha düşük boyutlu bir uzaya taşınıp, ÖS'nin bu uzayda yapılması ve bu daha düşük boyutlu uzayda seçilen aşırı öğrenmeye dayanıklı özelliklerin, asıl uzaya geri yansıtılmasıyla oluşan sonuçlar incelenmiştir.
Özet (Çeviri)
Feature selection (FS) is used in areas such as machine learning, data mining and bioinformatics to reduce the dimensionality of data and increase the performance of an algorithm such as a classification algorithm. FS techniques have become an apparent need in many applications because of the growing data size. In this paper, high-dimensionality problems, such as the curse of dimensionality and overfitting are considered. FS approaches that commonly used are explained and their advantages and disadvantages are discussed. It also proposes a theoretical solution for frequently encountered problems in FS applications. Datas harboring in a feature space are transformed to a lower dimensional space and features are selected in that space. This overfitting robust features are reconstructed to the primary space and are observed as the result of that process.
Benzer Tezler
- Localized multiple kernel algorithms for machine learning
Yapay öğrenme için yerel çoklu çekirdek algoritmaları
MEHMET GÖNEN
Doktora
İngilizce
2010
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. ETHEM ALPAYDIN
- Determining novel target genes in WNT/𝛽-catenin signaling pathway using machine learning
WNT/beta-catenin sinyal yolağında makine öğrenmesi ile hedef genler belirlenmesi
CEMRE KEFELİ
Yüksek Lisans
İngilizce
2022
Genetikİstanbul ÜniversitesiMoleküler Biyoloji ve Genetik Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ANDRES OCTAVIO ARAVENA DUARTE
- A mathematical contribution of statistical learning and continuous optimization using infinite and semi-infinite programming to computational statistics
İstatistiksel öğrenme ve sürekli optimizasyon yöntemlerinıin sonsuz ve yarı sonsuz programlama kullanılarak hesaplamalı istatistiğe uygulanması
SÜREYYA ÖZÖĞÜR AKYÜZ
Doktora
İngilizce
2009
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiBilimsel Hesaplama Ana Bilim Dalı
PROF. DR. GERHARD WİLHELM WEBER
PROF. DR. JOHN SHAWE TAYLOR
- Predicting multiple types of biological relationships with integrative non-negative matrix factorization
Bütüncül negatif olmayan matris faktörizasyonu ile çoklu biyolojik ilişki türlerinin öngörülmesi
ONUR SAVAŞ KARTLI
Yüksek Lisans
İngilizce
2022
BiyoistatistikOrta Doğu Teknik ÜniversitesiBiyoenformatik Ana Bilim Dalı
DOÇ. DR. YEŞİM AYDIN SON
DOÇ. DR. TUNCA DOĞAN
- Bitki transkripsiyon faktörlerinin hibrit derin öğrenme ile sınıflandırılması
Classification of plant transcription factors by hybrid deep learning
ALİ BURAK ÖNCÜL
Doktora
Türkçe
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKarabük ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ YÜKSEL ÇELİK