Geri Dön

Identification of biomarkers for cancer by machine learning

Kanser biyobelirteçlerinin makine öğrenmesi ile keşfi

  1. Tez No: 881636
  2. Yazar: MELTEM IŞIK
  3. Danışmanlar: PROF. DR. ŞEFİKA KUTLU ÜLGEN, DOÇ. DR. ARZUCAN ÖZGÜR TÜRKMEN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: İngilizce
  9. Üniversite: Boğaziçi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Hesaplamalı Bilimler ve Mühendislik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 136

Özet

Kanser en ölümcül hastalıklardan biridir ve erken tedavi başarılı bir iyileşme için çok önemlidir. Fakat erken tedavi için erken teşhiş gereklidir ve bu bir çok gelişmekte olan ülke için kolay bir süreç değildir. Teşhis sürecini hızlandırmak amaçlı, vücut sıvılarından kolayca saptanabilen biyobelirteçler kullanmak bunun çözümünde yardımcı olabilir. Ayrıca, kanserin bir kompleks hastalık olması ve genetik verinin bir büyük veri olmasından kaynaklı kansere sebep olabilecek genetik faktörlerin bulunması gerçekleştirilmesi zor başka bir işlemdir. Sağlıklı ve kanser barındıran dokulardan elde edilen verisetlerinden saptanan biyobelirteçler bu konudaki çalışmalar için bilgilendirici olabilir. Bu tez çalışmasında kanser biyobelirteçlerini saptamak için bir algoritma geliştirildi. Bu algoritmada, Temel Bileşenler Analizi boyutluluk azaltma tekniğinden de yardım alınarak bazı makine öğrenmesi modelleri kullanıldı. Ayrıca, sunulan algoritma, PREDIGENE adında, sağlıklı ve hasta dokuların gen expresyon verilerini içeren bir CSV dosyası yüklenerek kullanılabilecek, halka açık bir yazılıma dönüştürüldü. PREDIGENE her birinde üçer farklı veri seti olmak üzere iki farklı kanser türü üzerinde (meme kanseri ve karaciğer kanseri) toplam altı farklı veri setinde test edildi. PREDIGENE'in verdiği sonuçların bağıntılılığı ve tutarlılığı literatür taraması ve aynı amaç için geliştirilmiş başka bir yazılım ile karşılaştırması yapılarak incelendi. Sonuçta, bu çalışma kapsamında geliştirilen PREDIGENE kanser biyobelirteçlerinin saptanmasını yapay zeka teknolojisini kullanarak gerçekleştirmekte ve güncel literatür ile karşılaştırıldığında umut verici sonuçlar göstermektedir.

Özet (Çeviri)

Cancer is one of the deadliest diseases and early treatment is very important for successful recovery. However, early detection is required for early treatment, and currently, it is not an easy task for a lot of developing countries. Using biomarkers to fasten the diagnosis process may help to the solution of this since they can be detected through bodily fluids easily. Also, finding genetic factors leading to cancer is another task that is difficult to accomplish due to cancer being a complex disease as well as genetic data being a big data. Biomarkers detected from the healthy and cancerous tissue datasets may be informative for further research on this topic. In this thesis work, we developed an algorithm to detect biomarkers for cancer. Several machine learning models are used with the help of the PCA dimensionality reduction technique in the algorithm. The proposed algorithm is also converted to a publicly available software PREDIGENE which can be used by uploading a CSV file containing gene expression counts of healthy and diseased tissues. PREDIGENE is tested on two different cancer types (breast and liver) with six different datasets in total, three for each cancer type. The relevance and consistency of the results PREDIGENE returned are examined through a literature search and comparison with another publicly available tool developed for the same purpose. In conclusion, PREDIGENE, our tool to find cancer biomarkers through the usage of artificial intelligence, shows promising results when compared to the current literature.

Benzer Tezler

  1. Gaz kromatografisi kütle spektroskopisi verilerinden soluk havasındaki hedeflenmemiş uçucu organik biyobelirteçlerin tanımlanması

    Identification of untargeted volatile organic biomarkers in exhaled breath from gas chromatography mass spectroscopy data

    AYCAN ARIN

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    BiyoistatistikEge Üniversitesi

    Kimya Ana Bilim Dalı

    DOÇ. DR. LEVENT PELİT

  2. Makine öğrenmesi özellik seçimi (anova-boruta) ve sınıflandırma yaklaşımlarıyla pan-kanserde potansiyel mikroRNA biyobelirteçlerinin belirlenmesi

    Identification of potential microRNA biomarkers in pan-cancer using machine learning feature selection and classification approaches

    MELİKE KILIÇ

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    BiyolojiEge Üniversitesi

    Biyoloji Ana Bilim Dalı

    DOÇ. DR. SAVAŞ İZZETOĞLU

  3. Ağırlandırılmış gen ko-ekspresyon ağ analizininden (WGCNA) elde edilen biyobelirteçlerin kullanılmasıyla malign melanomda ilaç seçimi

    Drug selection for malignant melanoma using biomarkers generated by weighted gene co-expression network analysis (WGCNA)

    SEMİH ALPSOY

    Yüksek Lisans

    İngilizce

    İngilizce

    2017

    BiyoistatistikOrta Doğu Teknik Üniversitesi

    Sağlık Bilişimi Ana Bilim Dalı

    YRD. DOÇ. DR. AYBAR CAN ACAR

    DOÇ. DR. ALİ OSMAY GÜRE

  4. Biomarker identification for discrimination of cancer types

    Kanser türlerini ayırt edebilmek için biyoişaretçi tanımlaması

    CEM BUĞRA ALKAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolDokuz Eylül Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ZERRİN IŞIK

  5. Efficient machine learning models for cancer biology

    Kanser biyolojisi için etkin yapay öğrenme modelleri

    AYYÜCE BEGÜM BEKTAŞ

    Doktora

    İngilizce

    İngilizce

    2022

    Endüstri ve Endüstri MühendisliğiKoç Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DOÇ. DR. MEHMET GÖNEN