Geri Dön

DNA mikrodizi verileri kullanılarak kanser sınıflandırmasında topluluk öğrenimi

Cancer classification using DNA microarray data with ensemble learning

  1. Tez No: 943779
  2. Yazar: NAZRİN ABILOVA
  3. Danışmanlar: DR. ÖĞR. ÜYESİ YILMAZ ATAY
  4. Tez Türü: Yüksek Lisans
  5. Konular: Belirtilmemiş.
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2025
  8. Dil: Türkçe
  9. Üniversite: Gazi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 135

Özet

Kanser, dünya genelinde en yüksek ölüm oranlarına sahip hastalık gruplarından biridir. Son yıllarda, biyoteknolojik gelişmelerin de etkisiyle, gen ekspresyon verileri gibi moleküler biyobelirteçlere dayalı veriler, kanserin tanı ve teşhisinde devrim niteliğinde katkılar sağlamıştır. Özellikle DNA mikrodizi teknolojisi sayesinde, aynı anda on binlerce genin ekspresyon düzeyi ölçülebilmekte ve bu sayede kanserin moleküler düzeydeki dinamikleri daha ayrıntılı olarak analiz edilebilmektedir. Bununla birlikte, bu tür veriler genellikle“yüksek boyutlu ve düşük örnek sayılı”bir yapıya sahiptir. Bu yapı, geleneksel makine öğrenmesi algoritmaları için aşırı öğrenme riski taşımakta ve analiz sürecini oldukça karmaşık hale getirmektedir. Bu karmaşık veri yapısıyla başa çıkmak ve sınıflandırma performansını artırmak amacıyla, öznitelik seçimi yöntemleri ön plana çıkmaktadır. Öznitelik seçimi, yüksek boyutlu gen ekspresyon verilerinde yalnızca sınıflandırma açısından anlamlı ve etkili genleri belirleyerek hem gürültüyü azaltmakta hem de modellerin genellenebilirliğini artırmaktadır. Bu kapsamda geliştirilen yöntemler, çeşitli kategorilere ayrılmakta ve her biri farklı avantajlar sunmaktadır. Bu tez çalışmasında, 11 farklı kanser türüne ait mikrodizi gen ekspresyon veri setleri kullanılarak kapsamlı bir analiz gerçekleştirilmiştir. Çalışma kapsamında, her veri kümesi üzerinde çeşitli öznitelik seçimi yöntemleri hem tek başına hem de farklı kombinasyonlarla uygulanmıştır. Özellikle özellik seçim yöntemlerinin birlikte kullanılmasıyla oluşturulan öznitelik kümeleri hem bireysel hem de birleşim/kesişim stratejileriyle analiz edilmiştir. Bu sayede 12 farklı öznitelik seçimi kombinasyonu oluşturulmuş ve her biri yedi farklı hem klasik hem topluluk sınıflandırma algoritmasıyla test edilmiştir. Ayrıca, en başarılı öznitelik seçimi-sınıflandırıcı kombinasyonları istatistiksel olarak Friedman ve Nemenyi testleri ile karşılaştırılmıştır. Bu yaklaşım, öznitelik seçiminin sınıflandırma başarısı üzerindeki etkisini çok yönlü bir şekilde ortaya koymakta ve yüksek boyutlu biyolojik verilerin işlenmesinde etkili yöntemlerin belirlenmesine katkı sağlamaktadır.

Özet (Çeviri)

Cancer is one of the leading causes of mortality worldwide. In recent years, advances in biotechnology have significantly contributed to the diagnosis and prognosis of cancer through molecular biomarkers such as gene expression data. In particular, DNA microarray technology enables the simultaneous measurement of the expression levels of tens of thousands of genes, providing a more detailed understanding of the molecular dynamics of cancer. However, these datasets typically exhibit a“high-dimensional, low-sample-size”structure, which poses challenges for traditional machine learning algorithms due to the risk of overfitting and increased complexity in data analysis. To address these issues and improve classification performance, feature selection methods have become increasingly important. Feature selection aims to identify the most informative and relevant genes for classification, thereby reducing noise and enhancing model generalizability in high- dimensional gene expression data. These methods are categorized into various types, each offering distinct advantages. In this thesis, a comprehensive analysis was conducted using microarray gene expression datasets from 11 different cancer types. Various feature selection techniques were applied to each dataset both individually and in combination. In particular, feature subsets created through combinations of selection methods were evaluated using union and intersection strategies. As a result, 12 different feature selection combinations were generated and tested using seven different classification algorithms, including both traditional and ensemble methods.

Benzer Tezler

  1. Meta-analysis of microRNA and gene selection using machine learning

    Makine öğrenmesi kullanarak microRNA meta-analizi ve gen seçimi

    ELNAZ PASHAEI

    Doktora

    İngilizce

    İngilizce

    2017

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. NİZAMETTİN AYDIN

  2. Analysis of leukemia cancer classification with supervised machine learning and deep reinforcement learning based on gene expression monitoring (via DNA microarray)

    Denetimli makine öğrenimi ve gen ifade izlemeye dayalı derin takviyeli öğrenme ile lösemi kanseri sınıflandırmasının analizi (DNA mikrodizisi aracılığıyla)

    ZAID MOHAMMED IBRAHIM IBRAHIM

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÇukurova Üniversitesi

    Elektrik ve Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. ULUS ÇEVİK

    PROF. DR. TURGAY İBRİKÇİ

  3. Karaciğer hastalıklarında DNA diziliminin biyoenformatik hesaplamalarla irdelenmesi

    Analyzing DNA sequence in liver diseases by using bioinformatic computations

    SALİHA ACAR

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEskişehir Osmangazi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. EYYÜP GÜLBANDILAR

  4. Molecular and physiological investigation of longevity in yeast

    Maya hücrelerinde uzun yaşamın moleküler ve fizyolojik yönden incelenmesi

    MEVLÜT ARSLAN

    Doktora

    İngilizce

    İngilizce

    2017

    Biyoteknolojiİstanbul Teknik Üniversitesi

    Moleküler Biyoloji-Genetik ve Biyoteknoloji Ana Bilim Dalı

    PROF. DR. ZEYNEP PETEK ÇAKAR

  5. Makine öğrenmesi yöntemleri ile mikrodizi hedef gen çıkarımı

    Microarray target gene extraction with machine learning methods

    ZERRİN YILDIZ ÇAVDAR

    Doktora

    Türkçe

    Türkçe

    2025

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Üniversitesi-Cerrahpaşa

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. AHMET SERTBAŞ

    DOÇ. DR. LEYLA TÜRKER ŞENER