Geri Dön

Veri madenciliği yöntemi ile prostat kanseri için erken uyarı protokollerinin geliştirilmesi

Development of early warning protocols for prostate cancer by data mining method

  1. Tez No: 537732
  2. Yazar: ÖZİN KALEMCİ
  3. Danışmanlar: PROF. DR. MEHPARE TİMOR
  4. Tez Türü: Doktora
  5. Konular: Biyoistatistik, İstatistik, İşletme, Biostatistics, Statistics, Business Administration
  6. Anahtar Kelimeler: Sağlıkta Veri Madenciliği Uygulamaları, Karar Ağaçları, Stacking Yöntemi, K En Yakın Komşuluk Yöntemi, Naive Bayes Yöntemi, Bütünsel Genom İlişkilendirme, Tekli Nükleotid Polimorfizm, Data mining applications in healthcare, Decision Trees, Stacking Method, K Nearest Neighbor Method, Naive Bayes Method, Genome Wide Association Studies, Single Nucleotide Polymorphism
  7. Yıl: 2019
  8. Dil: Türkçe
  9. Üniversite: İstanbul Üniversitesi
  10. Enstitü: Sosyal Bilimler Enstitüsü
  11. Ana Bilim Dalı: Sayısal Yöntemler Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 145

Özet

Veri madenciliği, karar vericilerin eldeki verilerden yola çıkarak doğru ve etkin kararlar almasına yardımcı olan yöntemler topluluğudur. Veri madenciliği yöntemleri, özellikle tıp alanında daha çok tahmin edici yönüyle kullanılmaktadır. Son yıllarda yapılan çalışmalar veri madenciliği yöntemlerinin kanser de dahil olmak üzere bir çok hastalığın teşhis edilmesinde umut verici sonuçlar ortaya koyduğunu göstermektedir. Bu çalışmada amaç, veri madenciliği yöntemleri kullanılarak, prostat kanserinin erken ve doğru teşhis edilebilmesi için anlamlı bir model oluşturmaktır. Çalışmanın diğer teşhis etme çalışmalarından farkı, PSA veya rektal tuşe vb. gibi hiçbir tıbbi sonuç değişkeni içermemesi, sadece genetik ve fiziksel değişkenler içermesidir. Çalışmada stacking topluluk metodu altında bayes sınıflandırıcılar, k en yakın komşuluk ve karar ağacı yöntemleri kullanılarak bir topluluk modeli oluşturulmuştur. Bu model ile prostat kanseri olan ve olmayanların en doğru şekilde sınıflandırılması amaçlanmaktadır. Yapılan çalışmada 989 kişiden oluşan, her kişiye ait 200 bin SNP ve 18 adet fenotip değişken içeren prostat verisi kullanılmıştır. Modelin performans sonuçlarına bakıldığında; doğruluk, kesinlik ve duyarlılık değerleri sırasıyla %84,13, %89,84 ve %74,23'dür. Bu sonuçlara bakıldığında modelin prostat kanserini tahmin etme yeteneği başarılıdır.

Özet (Çeviri)

Data mining is a collection of methods that help decision makers to make accurate and effective decisions based on available data. Data mining methods are being used more often in the field of medicine, especially for predicting disease. Recent studies have shown that data mining methods have promising results in diagnosing many diseases, including cancer. The aim of this study is to establish a meaningful model for the early and accurate diagnosis of prostate cancer using data mining methods. The difference of the model from other diagnostic studies is that it does not involve any medical outcome variables, such as PSA or rectal key, but only genetic and physical variables. In the study, an ensemble model was constructed by using Bayesian classifiers, k nearest neighbor and decision tree methods under the stacking ensemble method. With this model, it is aimed to classify individials with and without prostate cancer in the most accurate way. In the study, prostate data consisting of 989 individuals, 200 thousand SNPs per each person and 18 phenotype variables were used. When the performance results of the model are considered; accuracy, precision and sensitivity values are 84,13%, 89,84% and 74,23% respectively. Given these results, the model has a good ability to predict prostate cancer.

Benzer Tezler

  1. Obtain anterior/posterior position of the tumor through machine learning

    Makine öğrenme yoluyla tümörün anterior/posterior pozisyonunu elde edin

    GOLSHAN GHOLAMPOUR

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik-Haberleşme Eğitimi Ana Bilim Dalı

    PROF. DR. İBRAHİM AKDUMAN

  2. Mikrodizi gen ifade verilerinde farklı öznitelik seçim yöntemleri ile sınıflama yöntemlerinin performanslarının değerlendirilmesi

    The effect of feature selection methods on the success of classification methods in microarray gene expression data

    ÖZLEM ARIK

    Doktora

    Türkçe

    Türkçe

    2020

    BiyoistatistikHacettepe Üniversitesi

    Biyoistatistik Ana Bilim Dalı

    PROF. DR. ERDEM KARABULUT

  3. Using data mining to reduce false positivies for pre-biopsy patients with moderate chance of having prostate cancer

    Prostat kanseri olma olasılığı olan biyopsi öncesi hastalarda yanlış tanıyı azaltmak için veri madenciliği uygulaması

    SELMİN DANIŞ

    Yüksek Lisans

    İngilizce

    İngilizce

    2003

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. İLKAY BODUROĞLU

  4. Lojistik regresyon analizi ve makine öğrenmesi algoritmaları ile prostat kanseri risk faktörlerinin belirlenmesi üzerine bir çalışma

    A study on the determination of prostate cancer risk factors by logistic regression analysis and machine learning algorithms

    SELMAN AKTAŞ

    Doktora

    Türkçe

    Türkçe

    2022

    Biyoistatistikİstanbul Üniversitesi-Cerrahpaşa

    Biyoistatistik Ana Bilim Dalı

    PROF. DR. MURAT KİRİŞCİ

  5. Sağlık alanında maliyet etkililik analizi ve bir uygulama

    Cost-effectiveness analysis in health field and an application

    MERVE CENGİZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    BiyoistatistikAdnan Menderes Üniversitesi

    Biyoistatistik Ana Bilim Dalı

    PROF. DR. MEVLÜT TÜRE