Geri Dön

Improving recursive cluster elimination approaches for gene expression analysis

Gen ifade miktarı verisi analizi için yinelemeli öbek eliminasyon yöntemlerinin iyileştirilmesi

  1. Tez No: 920460
  2. Yazar: CİHAN KUZUDİŞLİ
  3. Danışmanlar: DOÇ. DR. BURCU GÜNGÖR
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: İngilizce
  9. Üniversite: Abdullah Gül Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Biyoinformatik Bilim Dalı
  13. Sayfa Sayısı: 100

Özet

Yeni teknolojilerle üretilen biyolojik verilerin giderek artan boyutluluğunun neden olduğu hesaplama ve yorumlama güçlükleri önemli bir zorluk oluşturmaktadır. Özellik seçimi (FS) yöntemleri boyutu azaltmayı amaçlar ve özellik gruplaması, özellikler arasında güçlü korelasyonları tespit etmeyi ve ilgisiz özellikleri belirlemeyi amaçlayan FS teknikleri için bir temel olarak ortaya çıkmıştır. Bu tezde, gözetimli bir bağlamda özellik gruplandırmasını kullanan yöntemler geliştirilmiştir. Başlangıçta farklı kümeleme algoritmalarının SVM-RCE üzerindeki etkilerini test ettik ve K-means ile en iyi performansı gözlemledik. Geliştirilen ilk yöntem olan Öbek İçi Özellik Eleme ile Yinelemeli Öbek Eleme (RCE-IFE) yönteminde, her öbek azaltma adımında hem öbek hem de öbek içi eleme yinelemeli olarak gerçekleştirilir. Deneysel bulgularımız, RCE-IFE'nin güçlü bir sınıflandırıcı performansı sağladığını ve özellik ilgisini ve tutarlılığını korurken özellik boyutunu önemli ölçüde azalttığını göstermektedir. İkinci geliştirilen Gruplama – Puanlama – Model (G-S-M) tabanlı çalışma olan G-S-M_Rep'de, hastalık gruplarını oluşturmak için ön bilgileri kullanıyoruz ve her grubu temsil edecek en iyi özellikleri seçiyoruz. Bu temsili özellikler model tarafından kümülatif bir şekilde öğrenilir. Sonuçlar G-S-M_Rep'in az sayıda özellikle tatmin edici bir model performansına ulaştığını göstermektedir. Sonuç olarak, bu tez özellik gruplandırmaya dayalı yöntemleri sunmakta ve özellik azaltma yeteneğini, sınıflandırma performansını, özellik alaka düzeyini ve özellik tutarlılığını iyileştirmeye odaklanmaktadır.

Özet (Çeviri)

The computational and interpretational difficulties caused by the ever-increasing dimensionality of biological data generated by new technologies pose a significant challenge. Feature selection (FS) methods aim to reduce the dimension, and feature grouping has emerged as a foundation for FS techniques that seek to detect strong correlations among features and identify irrelevant features. In this thesis, methods that utilize feature grouping in a supervised context were developed. We initially tested the effects of different clustering algorithms on SVM-RCE and observed the best performance with K-means. In the first developed method, Recursive Cluster Elimination with Intra-cluster Feature Elimination (RCE-IFE), both cluster and intra-cluster elimination is performed recursively in each cluster reduction step. Our experimental findings imply that RCE-IFE provides robust classifier performance and significantly reduces feature size while maintaining feature relevance and consistency. In the second developed Grouping – Scoring – Model (G-S-M) based study, G-S-M_Rep, we use prior knowledge to form disease groups, and select top features as representative of each group. These representative features are learnt by the model in a cumulative manner. Results show that G-S-M_Rep attains satisfactory model performance with a small number of features. Consequently, this thesis presents methods based on feature grouping and focuses on improving feature reduction capability, classification performance, feature relevancy, and feature consistency.

Benzer Tezler

  1. Exploiting clustering patterns in training sets to improve classification performance of fully connected layers

    Tam bağlantılı katmanların sınıflandırma performansını iyileştirmek için eğitim setlerindeki kümeleme örüntülerinden faydalanma

    TOLGA AHMET KALAYCI

    Doktora

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DOÇ. DR. UMUT ASAN

  2. Etkin sorgu önerileri için kullanıcı sorgularının görev tabanlı yönetilmesi

    Task based management of user queries for effective query suggestions

    NURULLAH ATEŞ

    Doktora

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. YUSUF YASLAN

  3. Makine öğrenmesi teknikleri ile tahsilat davranışı tahmini: telekomünikasyon sektörü örneği

    Prediction of debt collection behaviour with machine learning techniques: A case study on telecommunication company customers

    ELİF EKİZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DOÇ. DR. BAŞAR ÖZTAYŞİ

  4. Sismik kesitlerde meydan süzgeçleme ile sinyal/gürültü oranının iyileştirilmesi

    Improving of signal/ noise ratio by median filters in seismic sections

    NİLÜFER DEĞİRMENCİOĞLU

    Yüksek Lisans

    Türkçe

    Türkçe

    1998

    Jeofizik MühendisliğiKaradeniz Teknik Üniversitesi

    Jeofizik Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. KENAN GELİŞLİ

  5. Kalman filtreleme yaklaşımı kullanılarak yağışölçer verisi ile meteoroloji radarı yağış tahmininin iyileştirilmesi

    Improving of meteorological radar rainfall estimation with using rain gauge data using kalman filtering approach

    ALİ KEMAL BAKIR

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    Meteorolojiİstanbul Üniversitesi-Cerrahpaşa

    Mühendislik Bilimleri Ana Bilim Dalı

    DOÇ. DR. PINAR KIRCI