Geri Dön

Makine öğrenmesi sınıflandırma yöntemleri ile meme kanserinin erken teşhisi

Early diagnosis of breast cancer with machine learning classification methods

  1. Tez No: 488078
  2. Yazar: MELİHA NUR DURAK
  3. Danışmanlar: DOÇ. DR. İBRAHİM DEMİR
  4. Tez Türü: Yüksek Lisans
  5. Konular: İstatistik, Statistics
  6. Anahtar Kelimeler: Makine Öğrenmesi, Lojistik regresyon, Destek Vektör Makineleri, Karar Ağaçları, Yapay Zeka, Machine Learning, Logistic Regression, Support Vector Machines, Decision Trees, Artificial Neural Networks
  7. Yıl: 2017
  8. Dil: Türkçe
  9. Üniversite: Yıldız Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: İstatistik Bilim Dalı
  13. Sayfa Sayısı: 83

Özet

Tıp alanında veri madenciliği yaklaşımı, gereksiz yöntemlerden kaçınarak hastalık teşhisinde daha doğru tahmin yapması, tıp uygulayıcılarına daha hızlı karar vermelerinde oldukça yardım sağlaması bakımından son yıllarda yaygın olarak kullanılmaktadır. Hastalığın teşhisinin kolaylaşması, daha doğru tahmin yapılması, gereksiz biyopsiden kaçınmak hasta sonuçlarını iyileştirmenin yanı sıra kullanılan maliyeti düşürür ve klinik çalışmaların artmasına olanak sağlar. Akciğer kanserinden sonra kadınlarda en yüksek ölüm oranı meme kanseridir. Bu çalışmada amaç gereksiz biyopsiden kaçınarak meme kanserinin erken teşhisini makine öğrenmesi yöntemleriyle araştırmaktır. Önceki çalışmalarda teşhis için tümör bilgilerini içeren değişkenler kullanılırken yapılan bu çalışmada daha çok kültürel ve fiziksel etkisi olan değişkenlerle çalışıldı. Erken teşhiste bu değişkenlerin ne kadar önemli olup olmadığı araştırıldığı gibi farklı değişkenlerle yapılan çalışmalarla da karşılaştırma imkânı sağlandı. Meme kanseri teşhisi için makine öğrenmesi sınıflandırma yöntemleri kullanılmıştır. Her yöntem kendi içinde yöntemin uygunluğuna göre değişkenlerde boyut azaltması yapmıştır. Her yönteme göre en etkili değişken farklılık göstermiştir. Aynı veri seti üzerinde iki farklı uygulama yapılmıştır. İlki veri setinin eğitim ve test seti olarak ayrılarak SPSS.18 Moduler programında yapılmış uygulamadır. İkincisi ise k-kat çapraz doğrulama ile Weka'da yapılan uygulamadır. Kullanılan makine öğrenmesi yöntemlerinden Lojistik Regresyon (%78) ve Naive Bayes (%78) en iyi sonucu vermiştir. Bunlardan sonra sırasıyla Destek Vektör Makineleri (%76), Karar Ağacı C5.0 algoritması (%76), ve Yapay Sinir Ağları (%74) modelleri gelmektedir. 3 kat çapraz doğrulama yapıldığı durumda en iyi sınıflandırma doğrulununu veren yöntemler sırasıyla, Karar Ağacı C5.0 algoritması (%76), Lojistik Regresyon (%73), Destek Vektör Makineleri (%73), Yapay Sinir Ağları (%73) ve Naive Bayes (%73) olarak bulunmuştur.

Özet (Çeviri)

In the medical fields, the data mining approach has been widely used in recent years in order to make more accurate prediction of disease diagnosis by avoiding unnecessary methods and to help medical practitioners make decisions more quickly. Being able to make easy diagnosis, more accurate prediction and avoiding unnecessary biopsys would enable to have better outcomes of diseases, as well as reducing the cost of unnecessary methods and allows for increased clinical trials. The breast N is the highest mortality rate in women after lung N. The purpose of this study is to investigate early detection of breast N by machine learning methods, avoiding unnecessary biopsy. In previous studies, while variables including tumor information were used for diagnosis, in this study, variables that were mostly cultural and physical influences were used. In early diagnosis, it was investigated whether these variables were important or not, and it was also compared with studies done with different variables. Machine learning classification methods for breast N diagnosis have been used. Each method has its own size reduction in the variables according to the suitability of the method. The most effective variable according to each method varied. Two different applications were made on the same data set. The data set is divided into training and test set and applied in SPSS.18 Modular program. The second is the application in Weka with k-fold cross validation. Logistic regression and Bayesian network are the best result of the machine learning methods used. After that, they are followed by support vector machines, CRT and C5.0 algorithm in decision trees and neural network. Logistic Regression (78%) and Naive Bayes (78%) were the best results of machine learning methods used. These are followed by Support Vector Machines (76%), Decision Tree C5.0 algorithm (76%), and Artificial Neural Networks (74%) respectively. 3 fold cross validation performed in the case, the methods that give the best classification accuracy are Decision Tree C5.0 algorithm (76%), Logistic Regression (73%), Support Vector Machines (73%), Artificial Neural Networks (73%) and Naive Bayes (73%).

Benzer Tezler

  1. Antenna design for breast cancer detection and machine learning approach for birth weight prediction

    Meme kanseri tespiti için anten tasarımı ve doğum ağırlığı tahmini için makine öğrenmesi yaklaşımı

    HALUK KIRKGÖZ

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ONUR KURT

  2. Makine öğrenmesi ve derin öğrenme teknikleri ile meme kanserinin karşılaştırmalı sınıflandırılması

    Comparative classification of breast cancer with machine learning and deep learning techniques

    MERVE KORKMAZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKocaeli Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ KAPLAN KAPLAN

  3. Servikal kanserlerin teşhisinde kullanılan makine öğrenmesi algoritmalarının karşılaştırmalı analizi

    Comparative analysis of machine learning algorithms used in the diagnosis of cervical cancers

    TOLGA ÖZLEN

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Aydın Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. ALİ GÜNEŞ

  4. Meme kanseri riskinin termal görüntüleme ve makine öğrenmesi ile saptanması

    Determination of breast cancer risk with thermal imaging and machine learning

    GÖZDE OKAL

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolPamukkale Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. SEZAİ TOKAT

    DR. ÖĞR. ÜYESİ METİN KAPIDERE

  5. Clinical assessment of the microwave imaging system forbreast cancer screening and early detection

    Meme kanseri tarama ve erken tanı için mikrodalgagörüntüleme sisteminin klinik değerlendirmesi

    ALEKSANDAR JANJIC

    Doktora

    İngilizce

    İngilizce

    2023

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    Prof. Dr. MEHMET ÇAYÖREN

    Prof. Dr. İBRAHİM AKDUMAN