Makine öğrenmesi sınıflandırma yöntemleri ile meme kanserinin erken teşhisi
Early diagnosis of breast cancer with machine learning classification methods
- Tez No: 488078
- Danışmanlar: DOÇ. DR. İBRAHİM DEMİR
- Tez Türü: Yüksek Lisans
- Konular: İstatistik, Statistics
- Anahtar Kelimeler: Makine Öğrenmesi, Lojistik regresyon, Destek Vektör Makineleri, Karar Ağaçları, Yapay Zeka, Machine Learning, Logistic Regression, Support Vector Machines, Decision Trees, Artificial Neural Networks
- Yıl: 2017
- Dil: Türkçe
- Üniversite: Yıldız Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: İstatistik Ana Bilim Dalı
- Bilim Dalı: İstatistik Bilim Dalı
- Sayfa Sayısı: 83
Özet
Tıp alanında veri madenciliği yaklaşımı, gereksiz yöntemlerden kaçınarak hastalık teşhisinde daha doğru tahmin yapması, tıp uygulayıcılarına daha hızlı karar vermelerinde oldukça yardım sağlaması bakımından son yıllarda yaygın olarak kullanılmaktadır. Hastalığın teşhisinin kolaylaşması, daha doğru tahmin yapılması, gereksiz biyopsiden kaçınmak hasta sonuçlarını iyileştirmenin yanı sıra kullanılan maliyeti düşürür ve klinik çalışmaların artmasına olanak sağlar. Akciğer kanserinden sonra kadınlarda en yüksek ölüm oranı meme kanseridir. Bu çalışmada amaç gereksiz biyopsiden kaçınarak meme kanserinin erken teşhisini makine öğrenmesi yöntemleriyle araştırmaktır. Önceki çalışmalarda teşhis için tümör bilgilerini içeren değişkenler kullanılırken yapılan bu çalışmada daha çok kültürel ve fiziksel etkisi olan değişkenlerle çalışıldı. Erken teşhiste bu değişkenlerin ne kadar önemli olup olmadığı araştırıldığı gibi farklı değişkenlerle yapılan çalışmalarla da karşılaştırma imkânı sağlandı. Meme kanseri teşhisi için makine öğrenmesi sınıflandırma yöntemleri kullanılmıştır. Her yöntem kendi içinde yöntemin uygunluğuna göre değişkenlerde boyut azaltması yapmıştır. Her yönteme göre en etkili değişken farklılık göstermiştir. Aynı veri seti üzerinde iki farklı uygulama yapılmıştır. İlki veri setinin eğitim ve test seti olarak ayrılarak SPSS.18 Moduler programında yapılmış uygulamadır. İkincisi ise k-kat çapraz doğrulama ile Weka'da yapılan uygulamadır. Kullanılan makine öğrenmesi yöntemlerinden Lojistik Regresyon (%78) ve Naive Bayes (%78) en iyi sonucu vermiştir. Bunlardan sonra sırasıyla Destek Vektör Makineleri (%76), Karar Ağacı C5.0 algoritması (%76), ve Yapay Sinir Ağları (%74) modelleri gelmektedir. 3 kat çapraz doğrulama yapıldığı durumda en iyi sınıflandırma doğrulununu veren yöntemler sırasıyla, Karar Ağacı C5.0 algoritması (%76), Lojistik Regresyon (%73), Destek Vektör Makineleri (%73), Yapay Sinir Ağları (%73) ve Naive Bayes (%73) olarak bulunmuştur.
Özet (Çeviri)
In the medical fields, the data mining approach has been widely used in recent years in order to make more accurate prediction of disease diagnosis by avoiding unnecessary methods and to help medical practitioners make decisions more quickly. Being able to make easy diagnosis, more accurate prediction and avoiding unnecessary biopsys would enable to have better outcomes of diseases, as well as reducing the cost of unnecessary methods and allows for increased clinical trials. The breast N is the highest mortality rate in women after lung N. The purpose of this study is to investigate early detection of breast N by machine learning methods, avoiding unnecessary biopsy. In previous studies, while variables including tumor information were used for diagnosis, in this study, variables that were mostly cultural and physical influences were used. In early diagnosis, it was investigated whether these variables were important or not, and it was also compared with studies done with different variables. Machine learning classification methods for breast N diagnosis have been used. Each method has its own size reduction in the variables according to the suitability of the method. The most effective variable according to each method varied. Two different applications were made on the same data set. The data set is divided into training and test set and applied in SPSS.18 Modular program. The second is the application in Weka with k-fold cross validation. Logistic regression and Bayesian network are the best result of the machine learning methods used. After that, they are followed by support vector machines, CRT and C5.0 algorithm in decision trees and neural network. Logistic Regression (78%) and Naive Bayes (78%) were the best results of machine learning methods used. These are followed by Support Vector Machines (76%), Decision Tree C5.0 algorithm (76%), and Artificial Neural Networks (74%) respectively. 3 fold cross validation performed in the case, the methods that give the best classification accuracy are Decision Tree C5.0 algorithm (76%), Logistic Regression (73%), Support Vector Machines (73%), Artificial Neural Networks (73%) and Naive Bayes (73%).
Benzer Tezler
- Antenna design for breast cancer detection and machine learning approach for birth weight prediction
Meme kanseri tespiti için anten tasarımı ve doğum ağırlığı tahmini için makine öğrenmesi yaklaşımı
HALUK KIRKGÖZ
Yüksek Lisans
İngilizce
2024
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ONUR KURT
- Makine öğrenmesi ve derin öğrenme teknikleri ile meme kanserinin karşılaştırmalı sınıflandırılması
Comparative classification of breast cancer with machine learning and deep learning techniques
MERVE KORKMAZ
Yüksek Lisans
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKocaeli ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ KAPLAN KAPLAN
- Servikal kanserlerin teşhisinde kullanılan makine öğrenmesi algoritmalarının karşılaştırmalı analizi
Comparative analysis of machine learning algorithms used in the diagnosis of cervical cancers
TOLGA ÖZLEN
Yüksek Lisans
Türkçe
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Aydın ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. ALİ GÜNEŞ
- Meme kanseri riskinin termal görüntüleme ve makine öğrenmesi ile saptanması
Determination of breast cancer risk with thermal imaging and machine learning
GÖZDE OKAL
Yüksek Lisans
Türkçe
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolPamukkale ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. SEZAİ TOKAT
DR. ÖĞR. ÜYESİ METİN KAPIDERE
- Clinical assessment of the microwave imaging system forbreast cancer screening and early detection
Meme kanseri tarama ve erken tanı için mikrodalgagörüntüleme sisteminin klinik değerlendirmesi
ALEKSANDAR JANJIC
Doktora
İngilizce
2023
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
Prof. Dr. MEHMET ÇAYÖREN
Prof. Dr. İBRAHİM AKDUMAN