Geri Dön

Makine öğrenmesi yöntemleri ile kanser hastalığı takibi

Cancer disease tracking with machine learning methods

  1. Tez No: 749898
  2. Yazar: CANER BOZKURT
  3. Danışmanlar: DR. ÖĞR. ÜYESİ TUNÇ AŞUROĞLU
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: Türkçe
  9. Üniversite: Başkent Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 150

Özet

Meme, akciğer, prostat ve mide kanserleri dünya genelinde en sık görülen kanser türleri olmuştur. Bu kanserlerin erken evrede tespiti ve teşhisi literatürde bir zorluk teşkil etmektedir. Hekimler kanser hastalarıyla uğraşırken, risk faktörü olan çeşitli tedavi yöntemleri arasından seçim yapmaktadır. Tedavinin riskleri faydalarından daha ağır basabileceğinden, klinik karar vermede tedavi programı kritik öneme sahiptir. Bu program hastanın önceki komorbiditilerine, aldığı ilaçlara ve geçirdiği tedavi prosedürlerine bakılarak hazırlanmaktadır. Hangi ilacın ve tedavinin kullanılacağına manuel olarak karar vermek çok zaman almakta ve zor olabilmektedir. Bu tez çalışmasında, meme, akciğer, prostat ve mide kanseri hastalarının hastane içi teşhis sonrası mortalite tahmini için tahmin oranını mümkün olduğunca yüksek tutan makine öğrenmesi yaklaşımları kullanılarak hesaplamalı bir çözüm sunulmuştur. Çözüm, elektronik sağlık sistemlerinden kolaylıkla elde edilebilen tanı, ilaç ve prosedür parametrelerinin analizine dayanmaktadır. Kanser hastalarının mortalite sonuçlarını tahmin etmek için sınıflandırmaya dayalı bir yaklaşım getirilmiş, model eğitimleri yapılmış ve bu sınıflandırıcıların performansları değerlendirilmiştir. Medical Information Mart in Intensive Care IV (MIMIC-IV) veri kümesi üzerinde Lojistik Regresyon, Karar Ağacı, Rastgele Orman, Destek Vektör Makinesi ve Çok Katmanlı Algılayıcı sınıflandırıcıları değerlendirilmiş ve bunlarla çeşitli deneyler yapılmıştır. Belirtilen kanser hastaları için tanı, ilaç ve tedavi özellikleri çıkarılmış ve Lojistik Regresyon ile ilişkili öznitelik seçimi yapılmıştır. Kolay erişilebilir elektronik sağlık verilerinin kullanılması ve yapılacak işlemlerin hafıza ve zaman kullanımı açısından hızlı ve etkin olabilmesi için az veri ile başarılı sonuç verecek şekilde sınıflandırıcı yapısı tasarlanmış ve doktorların yükünün azaltılması hedeflenmiştir. Makine öğrenimi modellerinin mortalite tahmin yetenekleri, F1 Makro Ortalaması ve AUC-ROC skor metrikleri ile değerlendirilmiştir. En iyi F1 skorları meme için 0.74, akciğer için 0.73, prostat için 0.82 ve mide kanseri için 0.79 olarak bulunmuştur. En iyi AUC-ROC skorları meme için 0.94, akciğer için 0.91, prostat için 0.96 ve mide kanseri için 0.88 olarak bulunmuştur. Sonuç olarak, en ilişkili öznitelikler kullanılarak, çıkan sonuçların her kanser türü için temel sonucuna benzer olduğu görülmüş ve bu yaklaşımın, veri ve kaynağın sınırlı olduğu durumlarda sağlık tesislerinde kolaylıkla kullanılabileceği ortaya konulmuştur.

Özet (Çeviri)

Breast, lung, prostate and stomach cancers have been the most common types of cancer worldwide. Detection and diagnosis of these cancers at an early stage poses a challenge in the literature. When dealing with cancer patients, physicians choose among various treatment methods with risk factors. The treatment program is critical in clinical decision making, as the risks of treatment may outweigh the benefits. This program is prepared by looking at the previous comorbidities of the patient, the medications he took and the treatment procedures he had undergone. Manually deciding which drug and treatment to use can be time consuming and difficult. In this thesis, a computational solution is presented for breast, lung, prostate and stomach cancer patients' in-hospital post-diagnosis mortality prediction using machine learning approaches that keep the prediction rate as high as possible. The solution is based on the analysis of diagnostic, drug and procedural parameters that are easily available from electronic health systems. In order to predict the mortality outcomes of cancer patients, a classification-based approach has been introduced, model training has been carried out, and the performances of these classifiers have been evaluated. Logistic Regression, Decision Tree, Random Forest, Support Vector Machine and Multi Layer Perceptron classifiers were evaluated on the Medical Information Mart in Intensive Care IV (MIMIC-IV) dataset and various experiments were carried out with them. Diagnosis, drug and treatment features were extracted for the specified cancer patients, and feature selection related to Logistic Regression was made. In order to use easily accessible electronic health data and to make the procedures to be done quickly and effectively in terms of memory and time usage, the classifier structure was designed to provide successful results with less data and it was aimed to reduce the burden of doctors. The mortality prediction abilities of the machine learning models were evaluated with the F1 Macro Mean and AUC-ROC score metrics. The best F1 scores were 0.74 for breast, 0.73 for lung, 0.82 for prostate and 0.79 for stomach cancer. The best AUROC scores were 0.94 for breast, 0.91 for lung, 0.96 for prostate and 0.88 for stomach cancer. As a result, using the most relevant features, it was seen that the results were similar to the main result for each cancer type, and it was revealed that this approach can be easily used in healthcare facilities where data and resources are limited.

Benzer Tezler

  1. Histopatolojik görüntülerin makine öğrenmesi yöntemleri ile analizi

    Analysis of histopathological images via machine learning methods

    ABDÜLKADİR ALBAYRAK

    Doktora

    Türkçe

    Türkçe

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. GÖKHAN BİLGİN

  2. Determining novel target genes in WNT/𝛽-catenin signaling pathway using machine learning

    WNT/beta-catenin sinyal yolağında makine öğrenmesi ile hedef genler belirlenmesi

    CEMRE KEFELİ

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Genetikİstanbul Üniversitesi

    Moleküler Biyoloji ve Genetik Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ANDRES OCTAVIO ARAVENA DUARTE

  3. Tıbbi görüntü analizi ve işlemede derin öğrenme modelleri

    Deep learning models on medical image analysis and processing

    YASİN KIRELLİ

    Doktora

    Türkçe

    Türkçe

    2022

    Endüstri ve Endüstri MühendisliğiSakarya Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DOÇ. DR. SEHER ARSLANKAYA

  4. Erken evre meme kanseri hastaların sağkalım sürelerinin ve olasılıklarının, geleneksel sağkalım yöntemleri ile makine ögrenmesi tekniklerinin R paket programında karşılaştırılması

    Comparison of survival periods and probabilities of early stage breast cancer patients with traditional survival methods and machine learning techniques in the R package program

    SİNAN UZUN

    Yüksek Lisans

    Türkçe

    Türkçe

    2020

    BiyoistatistikMarmara Üniversitesi

    Biyoistatistik Ana Bilim Dalı

    PROF. DR. GÜLNAZ NURAL BEKİROĞLU

  5. Makine öğrenmesi yöntemleri ile kanser hastalığı teşhisi

    Cancer disease diagnosis with machine learning methods

    EBRU AYDINDAĞ BAYRAK

    Doktora

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Üniversitesi-Cerrahpaşa

    Mühendislik Bilimleri Ana Bilim Dalı

    PROF. DR. PINAR KIRCI

    DR. ÖĞR. ÜYESİ TOLGA ENSARİ