Makine öğrenmesi yöntemleri ile kanser hastalığı takibi
Cancer disease tracking with machine learning methods
- Tez No: 749898
- Danışmanlar: DR. ÖĞR. ÜYESİ TUNÇ AŞUROĞLU
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: Türkçe
- Üniversite: Başkent Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
- Sayfa Sayısı: 150
Özet
Meme, akciğer, prostat ve mide kanserleri dünya genelinde en sık görülen kanser türleri olmuştur. Bu kanserlerin erken evrede tespiti ve teşhisi literatürde bir zorluk teşkil etmektedir. Hekimler kanser hastalarıyla uğraşırken, risk faktörü olan çeşitli tedavi yöntemleri arasından seçim yapmaktadır. Tedavinin riskleri faydalarından daha ağır basabileceğinden, klinik karar vermede tedavi programı kritik öneme sahiptir. Bu program hastanın önceki komorbiditilerine, aldığı ilaçlara ve geçirdiği tedavi prosedürlerine bakılarak hazırlanmaktadır. Hangi ilacın ve tedavinin kullanılacağına manuel olarak karar vermek çok zaman almakta ve zor olabilmektedir. Bu tez çalışmasında, meme, akciğer, prostat ve mide kanseri hastalarının hastane içi teşhis sonrası mortalite tahmini için tahmin oranını mümkün olduğunca yüksek tutan makine öğrenmesi yaklaşımları kullanılarak hesaplamalı bir çözüm sunulmuştur. Çözüm, elektronik sağlık sistemlerinden kolaylıkla elde edilebilen tanı, ilaç ve prosedür parametrelerinin analizine dayanmaktadır. Kanser hastalarının mortalite sonuçlarını tahmin etmek için sınıflandırmaya dayalı bir yaklaşım getirilmiş, model eğitimleri yapılmış ve bu sınıflandırıcıların performansları değerlendirilmiştir. Medical Information Mart in Intensive Care IV (MIMIC-IV) veri kümesi üzerinde Lojistik Regresyon, Karar Ağacı, Rastgele Orman, Destek Vektör Makinesi ve Çok Katmanlı Algılayıcı sınıflandırıcıları değerlendirilmiş ve bunlarla çeşitli deneyler yapılmıştır. Belirtilen kanser hastaları için tanı, ilaç ve tedavi özellikleri çıkarılmış ve Lojistik Regresyon ile ilişkili öznitelik seçimi yapılmıştır. Kolay erişilebilir elektronik sağlık verilerinin kullanılması ve yapılacak işlemlerin hafıza ve zaman kullanımı açısından hızlı ve etkin olabilmesi için az veri ile başarılı sonuç verecek şekilde sınıflandırıcı yapısı tasarlanmış ve doktorların yükünün azaltılması hedeflenmiştir. Makine öğrenimi modellerinin mortalite tahmin yetenekleri, F1 Makro Ortalaması ve AUC-ROC skor metrikleri ile değerlendirilmiştir. En iyi F1 skorları meme için 0.74, akciğer için 0.73, prostat için 0.82 ve mide kanseri için 0.79 olarak bulunmuştur. En iyi AUC-ROC skorları meme için 0.94, akciğer için 0.91, prostat için 0.96 ve mide kanseri için 0.88 olarak bulunmuştur. Sonuç olarak, en ilişkili öznitelikler kullanılarak, çıkan sonuçların her kanser türü için temel sonucuna benzer olduğu görülmüş ve bu yaklaşımın, veri ve kaynağın sınırlı olduğu durumlarda sağlık tesislerinde kolaylıkla kullanılabileceği ortaya konulmuştur.
Özet (Çeviri)
Breast, lung, prostate and stomach cancers have been the most common types of cancer worldwide. Detection and diagnosis of these cancers at an early stage poses a challenge in the literature. When dealing with cancer patients, physicians choose among various treatment methods with risk factors. The treatment program is critical in clinical decision making, as the risks of treatment may outweigh the benefits. This program is prepared by looking at the previous comorbidities of the patient, the medications he took and the treatment procedures he had undergone. Manually deciding which drug and treatment to use can be time consuming and difficult. In this thesis, a computational solution is presented for breast, lung, prostate and stomach cancer patients' in-hospital post-diagnosis mortality prediction using machine learning approaches that keep the prediction rate as high as possible. The solution is based on the analysis of diagnostic, drug and procedural parameters that are easily available from electronic health systems. In order to predict the mortality outcomes of cancer patients, a classification-based approach has been introduced, model training has been carried out, and the performances of these classifiers have been evaluated. Logistic Regression, Decision Tree, Random Forest, Support Vector Machine and Multi Layer Perceptron classifiers were evaluated on the Medical Information Mart in Intensive Care IV (MIMIC-IV) dataset and various experiments were carried out with them. Diagnosis, drug and treatment features were extracted for the specified cancer patients, and feature selection related to Logistic Regression was made. In order to use easily accessible electronic health data and to make the procedures to be done quickly and effectively in terms of memory and time usage, the classifier structure was designed to provide successful results with less data and it was aimed to reduce the burden of doctors. The mortality prediction abilities of the machine learning models were evaluated with the F1 Macro Mean and AUC-ROC score metrics. The best F1 scores were 0.74 for breast, 0.73 for lung, 0.82 for prostate and 0.79 for stomach cancer. The best AUROC scores were 0.94 for breast, 0.91 for lung, 0.96 for prostate and 0.88 for stomach cancer. As a result, using the most relevant features, it was seen that the results were similar to the main result for each cancer type, and it was revealed that this approach can be easily used in healthcare facilities where data and resources are limited.
Benzer Tezler
- Histopatolojik görüntülerin makine öğrenmesi yöntemleri ile analizi
Analysis of histopathological images via machine learning methods
ABDÜLKADİR ALBAYRAK
Doktora
Türkçe
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. GÖKHAN BİLGİN
- Determining novel target genes in WNT/𝛽-catenin signaling pathway using machine learning
WNT/beta-catenin sinyal yolağında makine öğrenmesi ile hedef genler belirlenmesi
CEMRE KEFELİ
Yüksek Lisans
İngilizce
2022
Genetikİstanbul ÜniversitesiMoleküler Biyoloji ve Genetik Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ANDRES OCTAVIO ARAVENA DUARTE
- Tıbbi görüntü analizi ve işlemede derin öğrenme modelleri
Deep learning models on medical image analysis and processing
YASİN KIRELLİ
Doktora
Türkçe
2022
Endüstri ve Endüstri MühendisliğiSakarya ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. SEHER ARSLANKAYA
- Erken evre meme kanseri hastaların sağkalım sürelerinin ve olasılıklarının, geleneksel sağkalım yöntemleri ile makine ögrenmesi tekniklerinin R paket programında karşılaştırılması
Comparison of survival periods and probabilities of early stage breast cancer patients with traditional survival methods and machine learning techniques in the R package program
SİNAN UZUN
Yüksek Lisans
Türkçe
2020
BiyoistatistikMarmara ÜniversitesiBiyoistatistik Ana Bilim Dalı
PROF. DR. GÜLNAZ NURAL BEKİROĞLU
- Makine öğrenmesi yöntemleri ile kanser hastalığı teşhisi
Cancer disease diagnosis with machine learning methods
EBRU AYDINDAĞ BAYRAK
Doktora
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Üniversitesi-CerrahpaşaMühendislik Bilimleri Ana Bilim Dalı
PROF. DR. PINAR KIRCI
DR. ÖĞR. ÜYESİ TOLGA ENSARİ