Identification of biomarkers for cancer by machine learning
Kanser biyobelirteçlerinin makine öğrenmesi ile keşfi
- Tez No: 881636
- Danışmanlar: PROF. DR. ŞEFİKA KUTLU ÜLGEN, DOÇ. DR. ARZUCAN ÖZGÜR TÜRKMEN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: İngilizce
- Üniversite: Boğaziçi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Hesaplamalı Bilimler ve Mühendislik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 136
Özet
Kanser en ölümcül hastalıklardan biridir ve erken tedavi başarılı bir iyileşme için çok önemlidir. Fakat erken tedavi için erken teşhiş gereklidir ve bu bir çok gelişmekte olan ülke için kolay bir süreç değildir. Teşhis sürecini hızlandırmak amaçlı, vücut sıvılarından kolayca saptanabilen biyobelirteçler kullanmak bunun çözümünde yardımcı olabilir. Ayrıca, kanserin bir kompleks hastalık olması ve genetik verinin bir büyük veri olmasından kaynaklı kansere sebep olabilecek genetik faktörlerin bulunması gerçekleştirilmesi zor başka bir işlemdir. Sağlıklı ve kanser barındıran dokulardan elde edilen verisetlerinden saptanan biyobelirteçler bu konudaki çalışmalar için bilgilendirici olabilir. Bu tez çalışmasında kanser biyobelirteçlerini saptamak için bir algoritma geliştirildi. Bu algoritmada, Temel Bileşenler Analizi boyutluluk azaltma tekniğinden de yardım alınarak bazı makine öğrenmesi modelleri kullanıldı. Ayrıca, sunulan algoritma, PREDIGENE adında, sağlıklı ve hasta dokuların gen expresyon verilerini içeren bir CSV dosyası yüklenerek kullanılabilecek, halka açık bir yazılıma dönüştürüldü. PREDIGENE her birinde üçer farklı veri seti olmak üzere iki farklı kanser türü üzerinde (meme kanseri ve karaciğer kanseri) toplam altı farklı veri setinde test edildi. PREDIGENE'in verdiği sonuçların bağıntılılığı ve tutarlılığı literatür taraması ve aynı amaç için geliştirilmiş başka bir yazılım ile karşılaştırması yapılarak incelendi. Sonuçta, bu çalışma kapsamında geliştirilen PREDIGENE kanser biyobelirteçlerinin saptanmasını yapay zeka teknolojisini kullanarak gerçekleştirmekte ve güncel literatür ile karşılaştırıldığında umut verici sonuçlar göstermektedir.
Özet (Çeviri)
Cancer is one of the deadliest diseases and early treatment is very important for successful recovery. However, early detection is required for early treatment, and currently, it is not an easy task for a lot of developing countries. Using biomarkers to fasten the diagnosis process may help to the solution of this since they can be detected through bodily fluids easily. Also, finding genetic factors leading to cancer is another task that is difficult to accomplish due to cancer being a complex disease as well as genetic data being a big data. Biomarkers detected from the healthy and cancerous tissue datasets may be informative for further research on this topic. In this thesis work, we developed an algorithm to detect biomarkers for cancer. Several machine learning models are used with the help of the PCA dimensionality reduction technique in the algorithm. The proposed algorithm is also converted to a publicly available software PREDIGENE which can be used by uploading a CSV file containing gene expression counts of healthy and diseased tissues. PREDIGENE is tested on two different cancer types (breast and liver) with six different datasets in total, three for each cancer type. The relevance and consistency of the results PREDIGENE returned are examined through a literature search and comparison with another publicly available tool developed for the same purpose. In conclusion, PREDIGENE, our tool to find cancer biomarkers through the usage of artificial intelligence, shows promising results when compared to the current literature.
Benzer Tezler
- Gaz kromatografisi kütle spektroskopisi verilerinden soluk havasındaki hedeflenmemiş uçucu organik biyobelirteçlerin tanımlanması
Identification of untargeted volatile organic biomarkers in exhaled breath from gas chromatography mass spectroscopy data
AYCAN ARIN
- Makine öğrenmesi özellik seçimi (anova-boruta) ve sınıflandırma yaklaşımlarıyla pan-kanserde potansiyel mikroRNA biyobelirteçlerinin belirlenmesi
Identification of potential microRNA biomarkers in pan-cancer using machine learning feature selection and classification approaches
MELİKE KILIÇ
- Ağırlandırılmış gen ko-ekspresyon ağ analizininden (WGCNA) elde edilen biyobelirteçlerin kullanılmasıyla malign melanomda ilaç seçimi
Drug selection for malignant melanoma using biomarkers generated by weighted gene co-expression network analysis (WGCNA)
SEMİH ALPSOY
Yüksek Lisans
İngilizce
2017
BiyoistatistikOrta Doğu Teknik ÜniversitesiSağlık Bilişimi Ana Bilim Dalı
YRD. DOÇ. DR. AYBAR CAN ACAR
DOÇ. DR. ALİ OSMAY GÜRE
- Biomarker identification for discrimination of cancer types
Kanser türlerini ayırt edebilmek için biyoişaretçi tanımlaması
CEM BUĞRA ALKAN
Yüksek Lisans
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolDokuz Eylül ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ZERRİN IŞIK
- Efficient machine learning models for cancer biology
Kanser biyolojisi için etkin yapay öğrenme modelleri
AYYÜCE BEGÜM BEKTAŞ
Doktora
İngilizce
2022
Endüstri ve Endüstri MühendisliğiKoç ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. MEHMET GÖNEN