Çok değişkenli verilerde sınıflandırma ve sağlık verileri üzerine uygulaması
Classification of multivariate data and application on health data
- Tez No: 668952
- Danışmanlar: DR. ÖĞR. ÜYESİ MUSTAFA CEM KASAPBAŞI
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2021
- Dil: Türkçe
- Üniversite: İstanbul Ticaret Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 79
Özet
Meme kanseri, dünyadaki en tehlikeli ve ikinci en yaygın kanser türlerinden biridir. Gelişmiş cihazlarla ve tıbbi tedavilerle meme kanseri ile mücadele daha kolay hale geldi. Meme kanseri tedavisinde en iyi sonucu elde etmek ve erken tanı için periyodik kontroller yapılmalıdır. Makine öğrenme teknikleri, tedavinin başarısını tahmin etmek veya teşhis etmek için kullanılır. Bu çalışmada meme kanserinin erken tespiti için K-En Yakın Komşu (k-NN), Destek Vektör Makinesi (SVM), Naïve Bayes (NB), Lojistik Regresyon (LR) ve Rastgele Ormanlar (RF) sınıflandırıcısı makine öğrenmesi algoritmaları kullanılmıştır. Kullanılan veri seti, yaş, glikoz, BMI, resistin, insülin, adiponektin, HOMA, MCP1 ve leptin özelliklerinden oluşan UCI kütüphanesinden alınan Coimbra meme kanser veri setidir. Yaş, Resistin, Glikoz ve BMI kullanan K-En Yakın Komşu modeli en yüksek sonuçları vermektedir. Burada özgüllüğün % 90'ı hassasiyetin % 84'ü ve % 87.5'i doğruluk elde edilir. SVM algoritması, çalışmamızda % 83 doğruluk oranıyla ikinci en yüksek doğruluğu elde edildi. Ayrıca, RF algoritması % 79 doğruluk oranına, NB algoritması % 79 doğruluk oranına ve LR algoritmasının % 75 doğruluk oranına elde edildi. Bu bulgular resistin, glikoz, yaş ve BMI'yı birleştiren modellerin meme kanseri tespiti için güçlü bir araç olabileceğine dair umut verici kanıtlar sunmaktadır.
Özet (Çeviri)
Breast cancer is one of the most dangerous and second most common types of cancer in the world. Breast cancer-fighting with developed devices and medical therapies has become easier. To obtain the best result in breast cancer treatment, periodic checks should be carried out to follow the early diagnosis. Data Mining techniques are used to predict the success of treatment or diagnosis. In this study, the K-Nearest Neighbor (k-NN), Support Vector Machine (SVM), Naïve Bayes (NB), Logistic Regression (LR), and Random Forests (RF) classifier algorithms of machine learning were used for early detection of breast cancer. From the UC Irvine Machine Learning Repository (UCI) library Coimbra Breast Cancer data set which consists of age, glucose, body mass index (BMI), resistin, insulin, adiponectin, homeostatic model assessment (HOMA), monocyte chemoattractant protein-1 (MCP1), and leptin attributes were used. K-NN model using Age, Resistin, Glucose, and BMI give the highest results, where 90% of specificity 84% percent of sensitivity, and 87.5% accuracy is achieved. The SVM algorithm achieved the second-highest accuracy in our study with an 83% accuracy rate. Also, the RF algorithm has a 79% accuracy rate, the NB algorithm a 79% accuracy rate, and the LR algorithm has a 75% accuracy rate. These findings provide promising evidence that models combining resistin, glucose, age, and BMI may be a powerful tool for breast cancer detection.
Benzer Tezler
- Characterization of Turkish bee products such as propolis, pollen and royal jelly in terms of bioactive components, health effects and encapsulation
Türkiye'ye ait arı sütü, propolis ve polen gibi arı ürünlerinin biyoaktif bileşenler, sağlık etkileri ve enkapsülasyonu açısından karakterizasyonu
ÜMİT ALTUNTAŞ
Doktora
İngilizce
2023
Gıda Mühendisliğiİstanbul Teknik ÜniversitesiGıda Mühendisliği Ana Bilim Dalı
PROF. DR. BERAAT ÖZÇELİK
- A hierarchical key assignment scheme: A unified approach for scalability and efficiency, with a specialized implementation in cloud computing
Hiyerarşik anahtar atama şeması: Ölçeklenebilirlik ve verimlilik için bütünleşik bir yaklaşım ve bulut bilişim için özelleştirilmiş bir gerçekleme
İBRAHİM ÇELİKBİLEK
Doktora
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilişim Uygulamaları Ana Bilim Dalı
PROF. DR. ENVER ÖZDEMİR
- Bulanık su altı görüntülerinde derin öğrenme tabanlı balık tespiti
Deep learning based fish detection in turbid underwater images
TANSEL AKGÜL
Yüksek Lisans
Türkçe
2020
Bilim ve Teknolojiİstanbul Teknik ÜniversitesiUydu Haberleşmesi ve Uzaktan Algılama Ana Bilim Dalı
DOÇ. DR. BEHÇET UĞUR TÖREYİN
- Generalized multi-view data proliferator (gem-vip) for boosting classification
Genelleştirilmiş çok boyutlu veri üretimi ile sınıflandırma hassaslığının yükseltilmesi
MUSTAFA ÇELİK
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ISLEM REKIK
- Derin öğrenme ve büyük veri analitiği yöntemleriKullanarak Covid-19 yayılımının ileriye dönük tahmini
Forecasting the spread of covid-19 using deep learning and big data analytics methods
CYLAS KIGANDA
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilgisayar Bilimleri Ana Bilim Dalı
PROF. DR. MUHAMMET ALİ AKCAYOL