Improving recursive cluster elimination approaches for gene expression analysis
Gen ifade miktarı verisi analizi için yinelemeli öbek eliminasyon yöntemlerinin iyileştirilmesi
- Tez No: 920460
- Danışmanlar: DOÇ. DR. BURCU GÜNGÖR
- Tez Türü: Doktora
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: İngilizce
- Üniversite: Abdullah Gül Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Biyoinformatik Bilim Dalı
- Sayfa Sayısı: 100
Özet
Yeni teknolojilerle üretilen biyolojik verilerin giderek artan boyutluluğunun neden olduğu hesaplama ve yorumlama güçlükleri önemli bir zorluk oluşturmaktadır. Özellik seçimi (FS) yöntemleri boyutu azaltmayı amaçlar ve özellik gruplaması, özellikler arasında güçlü korelasyonları tespit etmeyi ve ilgisiz özellikleri belirlemeyi amaçlayan FS teknikleri için bir temel olarak ortaya çıkmıştır. Bu tezde, gözetimli bir bağlamda özellik gruplandırmasını kullanan yöntemler geliştirilmiştir. Başlangıçta farklı kümeleme algoritmalarının SVM-RCE üzerindeki etkilerini test ettik ve K-means ile en iyi performansı gözlemledik. Geliştirilen ilk yöntem olan Öbek İçi Özellik Eleme ile Yinelemeli Öbek Eleme (RCE-IFE) yönteminde, her öbek azaltma adımında hem öbek hem de öbek içi eleme yinelemeli olarak gerçekleştirilir. Deneysel bulgularımız, RCE-IFE'nin güçlü bir sınıflandırıcı performansı sağladığını ve özellik ilgisini ve tutarlılığını korurken özellik boyutunu önemli ölçüde azalttığını göstermektedir. İkinci geliştirilen Gruplama – Puanlama – Model (G-S-M) tabanlı çalışma olan G-S-M_Rep'de, hastalık gruplarını oluşturmak için ön bilgileri kullanıyoruz ve her grubu temsil edecek en iyi özellikleri seçiyoruz. Bu temsili özellikler model tarafından kümülatif bir şekilde öğrenilir. Sonuçlar G-S-M_Rep'in az sayıda özellikle tatmin edici bir model performansına ulaştığını göstermektedir. Sonuç olarak, bu tez özellik gruplandırmaya dayalı yöntemleri sunmakta ve özellik azaltma yeteneğini, sınıflandırma performansını, özellik alaka düzeyini ve özellik tutarlılığını iyileştirmeye odaklanmaktadır.
Özet (Çeviri)
The computational and interpretational difficulties caused by the ever-increasing dimensionality of biological data generated by new technologies pose a significant challenge. Feature selection (FS) methods aim to reduce the dimension, and feature grouping has emerged as a foundation for FS techniques that seek to detect strong correlations among features and identify irrelevant features. In this thesis, methods that utilize feature grouping in a supervised context were developed. We initially tested the effects of different clustering algorithms on SVM-RCE and observed the best performance with K-means. In the first developed method, Recursive Cluster Elimination with Intra-cluster Feature Elimination (RCE-IFE), both cluster and intra-cluster elimination is performed recursively in each cluster reduction step. Our experimental findings imply that RCE-IFE provides robust classifier performance and significantly reduces feature size while maintaining feature relevance and consistency. In the second developed Grouping – Scoring – Model (G-S-M) based study, G-S-M_Rep, we use prior knowledge to form disease groups, and select top features as representative of each group. These representative features are learnt by the model in a cumulative manner. Results show that G-S-M_Rep attains satisfactory model performance with a small number of features. Consequently, this thesis presents methods based on feature grouping and focuses on improving feature reduction capability, classification performance, feature relevancy, and feature consistency.
Benzer Tezler
- Exploiting clustering patterns in training sets to improve classification performance of fully connected layers
Tam bağlantılı katmanların sınıflandırma performansını iyileştirmek için eğitim setlerindeki kümeleme örüntülerinden faydalanma
TOLGA AHMET KALAYCI
Doktora
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. UMUT ASAN
- Etkin sorgu önerileri için kullanıcı sorgularının görev tabanlı yönetilmesi
Task based management of user queries for effective query suggestions
NURULLAH ATEŞ
Doktora
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. YUSUF YASLAN
- Makine öğrenmesi teknikleri ile tahsilat davranışı tahmini: telekomünikasyon sektörü örneği
Prediction of debt collection behaviour with machine learning techniques: A case study on telecommunication company customers
ELİF EKİZ
Yüksek Lisans
Türkçe
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. BAŞAR ÖZTAYŞİ
- Sismik kesitlerde meydan süzgeçleme ile sinyal/gürültü oranının iyileştirilmesi
Improving of signal/ noise ratio by median filters in seismic sections
NİLÜFER DEĞİRMENCİOĞLU
Yüksek Lisans
Türkçe
1998
Jeofizik MühendisliğiKaradeniz Teknik ÜniversitesiJeofizik Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. KENAN GELİŞLİ
- Kalman filtreleme yaklaşımı kullanılarak yağışölçer verisi ile meteoroloji radarı yağış tahmininin iyileştirilmesi
Improving of meteorological radar rainfall estimation with using rain gauge data using kalman filtering approach
ALİ KEMAL BAKIR
Yüksek Lisans
Türkçe
2018
Meteorolojiİstanbul Üniversitesi-CerrahpaşaMühendislik Bilimleri Ana Bilim Dalı
DOÇ. DR. PINAR KIRCI