DNA mikrodizi verileri kullanılarak kanser sınıflandırmasında topluluk öğrenimi
Cancer classification using DNA microarray data with ensemble learning
- Tez No: 943779
- Danışmanlar: DR. ÖĞR. ÜYESİ YILMAZ ATAY
- Tez Türü: Yüksek Lisans
- Konular: Belirtilmemiş.
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2025
- Dil: Türkçe
- Üniversite: Gazi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 135
Özet
Kanser, dünya genelinde en yüksek ölüm oranlarına sahip hastalık gruplarından biridir. Son yıllarda, biyoteknolojik gelişmelerin de etkisiyle, gen ekspresyon verileri gibi moleküler biyobelirteçlere dayalı veriler, kanserin tanı ve teşhisinde devrim niteliğinde katkılar sağlamıştır. Özellikle DNA mikrodizi teknolojisi sayesinde, aynı anda on binlerce genin ekspresyon düzeyi ölçülebilmekte ve bu sayede kanserin moleküler düzeydeki dinamikleri daha ayrıntılı olarak analiz edilebilmektedir. Bununla birlikte, bu tür veriler genellikle“yüksek boyutlu ve düşük örnek sayılı”bir yapıya sahiptir. Bu yapı, geleneksel makine öğrenmesi algoritmaları için aşırı öğrenme riski taşımakta ve analiz sürecini oldukça karmaşık hale getirmektedir. Bu karmaşık veri yapısıyla başa çıkmak ve sınıflandırma performansını artırmak amacıyla, öznitelik seçimi yöntemleri ön plana çıkmaktadır. Öznitelik seçimi, yüksek boyutlu gen ekspresyon verilerinde yalnızca sınıflandırma açısından anlamlı ve etkili genleri belirleyerek hem gürültüyü azaltmakta hem de modellerin genellenebilirliğini artırmaktadır. Bu kapsamda geliştirilen yöntemler, çeşitli kategorilere ayrılmakta ve her biri farklı avantajlar sunmaktadır. Bu tez çalışmasında, 11 farklı kanser türüne ait mikrodizi gen ekspresyon veri setleri kullanılarak kapsamlı bir analiz gerçekleştirilmiştir. Çalışma kapsamında, her veri kümesi üzerinde çeşitli öznitelik seçimi yöntemleri hem tek başına hem de farklı kombinasyonlarla uygulanmıştır. Özellikle özellik seçim yöntemlerinin birlikte kullanılmasıyla oluşturulan öznitelik kümeleri hem bireysel hem de birleşim/kesişim stratejileriyle analiz edilmiştir. Bu sayede 12 farklı öznitelik seçimi kombinasyonu oluşturulmuş ve her biri yedi farklı hem klasik hem topluluk sınıflandırma algoritmasıyla test edilmiştir. Ayrıca, en başarılı öznitelik seçimi-sınıflandırıcı kombinasyonları istatistiksel olarak Friedman ve Nemenyi testleri ile karşılaştırılmıştır. Bu yaklaşım, öznitelik seçiminin sınıflandırma başarısı üzerindeki etkisini çok yönlü bir şekilde ortaya koymakta ve yüksek boyutlu biyolojik verilerin işlenmesinde etkili yöntemlerin belirlenmesine katkı sağlamaktadır.
Özet (Çeviri)
Cancer is one of the leading causes of mortality worldwide. In recent years, advances in biotechnology have significantly contributed to the diagnosis and prognosis of cancer through molecular biomarkers such as gene expression data. In particular, DNA microarray technology enables the simultaneous measurement of the expression levels of tens of thousands of genes, providing a more detailed understanding of the molecular dynamics of cancer. However, these datasets typically exhibit a“high-dimensional, low-sample-size”structure, which poses challenges for traditional machine learning algorithms due to the risk of overfitting and increased complexity in data analysis. To address these issues and improve classification performance, feature selection methods have become increasingly important. Feature selection aims to identify the most informative and relevant genes for classification, thereby reducing noise and enhancing model generalizability in high- dimensional gene expression data. These methods are categorized into various types, each offering distinct advantages. In this thesis, a comprehensive analysis was conducted using microarray gene expression datasets from 11 different cancer types. Various feature selection techniques were applied to each dataset both individually and in combination. In particular, feature subsets created through combinations of selection methods were evaluated using union and intersection strategies. As a result, 12 different feature selection combinations were generated and tested using seven different classification algorithms, including both traditional and ensemble methods.
Benzer Tezler
- Meta-analysis of microRNA and gene selection using machine learning
Makine öğrenmesi kullanarak microRNA meta-analizi ve gen seçimi
ELNAZ PASHAEI
Doktora
İngilizce
2017
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. NİZAMETTİN AYDIN
- Analysis of leukemia cancer classification with supervised machine learning and deep reinforcement learning based on gene expression monitoring (via DNA microarray)
Denetimli makine öğrenimi ve gen ifade izlemeye dayalı derin takviyeli öğrenme ile lösemi kanseri sınıflandırmasının analizi (DNA mikrodizisi aracılığıyla)
ZAID MOHAMMED IBRAHIM IBRAHIM
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÇukurova ÜniversitesiElektrik ve Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. ULUS ÇEVİK
PROF. DR. TURGAY İBRİKÇİ
- Karaciğer hastalıklarında DNA diziliminin biyoenformatik hesaplamalarla irdelenmesi
Analyzing DNA sequence in liver diseases by using bioinformatic computations
SALİHA ACAR
Yüksek Lisans
Türkçe
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEskişehir Osmangazi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. EYYÜP GÜLBANDILAR
- Molecular and physiological investigation of longevity in yeast
Maya hücrelerinde uzun yaşamın moleküler ve fizyolojik yönden incelenmesi
MEVLÜT ARSLAN
Doktora
İngilizce
2017
Biyoteknolojiİstanbul Teknik ÜniversitesiMoleküler Biyoloji-Genetik ve Biyoteknoloji Ana Bilim Dalı
PROF. DR. ZEYNEP PETEK ÇAKAR
- Makine öğrenmesi yöntemleri ile mikrodizi hedef gen çıkarımı
Microarray target gene extraction with machine learning methods
ZERRİN YILDIZ ÇAVDAR
Doktora
Türkçe
2025
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Üniversitesi-CerrahpaşaBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. AHMET SERTBAŞ
DOÇ. DR. LEYLA TÜRKER ŞENER