Geri Dön

Using data mining to reduce false positivies for pre-biopsy patients with moderate chance of having prostate cancer

Prostat kanseri olma olasılığı olan biyopsi öncesi hastalarda yanlış tanıyı azaltmak için veri madenciliği uygulaması

  1. Tez No: 139336
  2. Yazar: SELMİN DANIŞ
  3. Danışmanlar: YRD. DOÇ. DR. İLKAY BODUROĞLU
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Endüstri ve Endüstri Mühendisliği, Üroloji, Computer Engineering and Computer Science and Control, Industrial and Industrial Engineering, Urology
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2003
  8. Dil: İngilizce
  9. Üniversite: Boğaziçi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Endüstri Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 103

Özet

ÖZET PROSTAT KANSERİ OLMA OLASILIĞI OLAN BİYOPSİ ÖNCESİ HASTALARDA YANLIŞ TANIYI AZALTMAK İÇİN VERİ MADENCİLİĞİ UYGULAMASI 50 yaş ve üstündeki erkeklerde prostat kanseri teşhisi için üç adet veri maden ciliği yöntemi kullanılmıştır. Bunlar: Karar Ağacı, Yapay Sinir Ağları ve K-En Yakın Komşu Algoritmasıdır. Bu erkekler, biyopsi öncesi“koyu gri tanı alanı”na girmekte dir. Biz koyu gri alanı Rektal Muayene sonucu normal olmak ve toplam PSA değeri 4 ile 20 ng/ml arasında bulunmak şeklinde tanımladık. Tıbbi çevrelerce çok iyi bili nen“gri alan”tanımının yukarıdaki tanımdan tek farkı, PSA değerinin 4 ile 10 ng/ml arasında olmasıdır. Biz tek bir kanserli hastayı bile kaçırmadan koyu gri alandaki gerek siz biyopsi alanını daraltmak istiyoruz. Finansal Risk Yönetimi kuramında da olduğu gibi, hata maliyeti çok yüksek olan özel bir sınıflandırma problemiyle karşı karşıyayız. Bu çalışmada 139 hasta yer almıştır. Veri madenciliği algoritmalarında kullandığımız girdi değişkenleri hastanın yaşı, serbest PSA, PSA yoğunluğu, serbest PSA'mn toplam PSA'ya oranı ve PCA teşhisinde ilk kez kullanılan bir değişken olan total PSA'mn kısa dönemdeki (10 gün) değişkenlik katsayısı scvtPSA'dır. Önce, bu değişkenleri kul lanarak bir karar ağacı oluşturduk. Karar ağacı eğitim veri setiyle eğitildikten sonra ve eğitim veri setiyle denendiğinde bir tek kanserli hastaya bile yanlış tam koymadı ve yüzde 68.8 yanlış alarm oranı verdi. Test veri setiyle denendiğinde ise yanlış alarm oram yüzde 55.6'ya düştü ve bir tek kanserli hastaya bile yanlış tanı konulmadı. (Bunun dışında, Karar Ağacı gri alanda denendiğinde literatürdeki gri alan sonuçlarına benzer sonuçlar verdi). K-En Yakın Komşu Algoritması ve Karar Ağacının doğrusal bileşkesi de tatmin edici sonuçlar verdi. Ayrıca, scvtPSA'nm Prostat Kanseri teşhisinde koyu gri alan için etkin bir değişken olduğu sonucuna varıldı.

Özet (Çeviri)

IV ABSTRACT USING DATA MINING TO REDUCE FALSE POSITIVES FOR PRE-BIOPSY PATIENTS WITH MODERATE CHANCE OF HAVING PROSTATE CANCER Three data mining tools, namely a Decision Tree, an Artificial Neural Network and the Kth Nearest Neighbor Algorithm, are employed to detect prostate cancer among men above the age of 50. These men belong to what we call the pre-biopsy diagnostic“dark gray zone”. We define the dark gray zone as having a normal Digital Rectal Examination result and a total Prostate-Specific Antigen level between 4 and 20 ng/ml. The dark gray zone is a superset of the well-known“gray zone”whose definition is identical to that of the former with the only exception that the PSA level falls between 4 and 10 ng/ml. We want to reduce the unnecessary biopsies in the dark gray zone while not missing a single cancer patient. Because the cost of making an error of type one is very high, we have a special kind of a classification problem, which is also seen in Financial Risk Management Theory. 139 patients were included in the study. As input variables to our data mining tools, we use age of patient, free PSA, PSA density, the ratio of free to total PSA, and the short term (10-day) coefficient of variance of total PSA, namely scvtPSA, a novel variable used for the first time in prediction of prostate cancer. First, we develop a decision tree model using these variables. The decision tree trained with the training data gives a false positive rate of 68.8 per cent when tested on the training data when we fix the sensitivity at 100 per cent. For the test data, its false positive rate value decreases to 55.6 per cent while the sensitivity is successfully maintained at 100 per cent. (Our Decision Tree gives results comparable to those in the existing literature for patients in the gray zone as well.) A linear combination of Kth Nearest Neighbor Algorithm and Decision Tree results is also satisfactory. We also conclude scvtPSA is significant in predicting prostate cancer in the dark gray zone.

Benzer Tezler

  1. Improving ids alerts to improve the quality of the network security by using data mining techniques

    Veri madenciliği tekniklerini kullanarak ağ güvenliğinin kalitesinin iyileştirilmesi için ıds alertını geliştirme

    ISAM KAREEM THAJEEL THAJEEL

    Yüksek Lisans

    İngilizce

    İngilizce

    2017

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAltınbaş Üniversitesi

    PROF. DR. OSMAN NURİ UÇAN

  2. Management and assessment system for network attacks based on data mining techniques

    Veri madenciliği tekniklerine dayanılarak ağ saldırıları için yönetim ve değerlendirme sistemi

    AHMED SAMI ABDULLAH

    Yüksek Lisans

    İngilizce

    İngilizce

    2017

    Bilim ve TeknolojiTürk Hava Kurumu Üniversitesi

    Bilişim Teknolojileri Ana Bilim Dalı

    Assist. Prof. SHADI ALSHEHABI

  3. Güvenlik sistemleri iz bilgilerinin veri madenciliği kullanılarak etkin analizi

    Effective analysis of security systems logs by using data mining methods

    IŞIL ÇİNAR

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. HASAN ŞAKİR BİLGE

  4. An issue recommender model using the developer collaboration network

    Yazılım geliştirici ortak çalışma ağı kullanan hata raporu öneri modeli

    BORA ÇAĞLAYAN

    Doktora

    İngilizce

    İngilizce

    2014

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. AYŞE BENER

    PROF. DR. MEHMET OĞUZ TOSUN

  5. Yakın alan sayısal kodlu radar sistemi tasarımı ve benzetimi

    Near field digital coded radar system design and simulation

    FATİH AKGÜL

    Yüksek Lisans

    Türkçe

    Türkçe

    2020

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    PROF. DR. SELÇUK PAKER