Hastalık tahmininde makine öğrenmesi sınıflandırma algoritmalarının karşılaştırılması ve bootstrap metodu kullanımı
Comparison of machine learning classification algorithms and using the bootstrap method in disease prediction
- Tez No: 771612
- Danışmanlar: DOÇ. DR. SEDA BAĞDATLI KALKAN
- Tez Türü: Yüksek Lisans
- Konular: İstatistik, Statistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: Türkçe
- Üniversite: İstanbul Ticaret Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: İstatistik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 99
Özet
Sağlık alanında uzun yıllarca verilerin kayıt altında tutulması ile büyük veri yığınları oluşmaktadır. Veri yığınları makine öğrenmesi yöntemleri kullanılarak sınıflandırılabilir ve daha anlaşılabilir duruma getirilebilir. Bu yöntemler aynı zamanda birçok hastalık tanısının tahmin edilmesine olanak sağlamaktadır. Bu çalışmada, günümüzde küresel olarak ölüm nedenlerinde birinci sırada yer alan Kardiyovasküler Hastalığın erken teşhisi için çeşitli risk faktörleri değerlendirilmiştir. Hastalığın erken tanısı tedavi sürecini hızlandıracağı için sağlık alanında büyük önem taşımaktadır. Bu çalışmada kullanılan veri seti, Kaggle platformu üzerinden elde edilen,“UCI Machine Learning Repository”veri tabanına ait 5 farklı veri setinden 11 ortak özellik altında birleştirilmiş verilerden oluşmaktadır. Çalışmada makine öğrenmesi sınıflandırma algoritmalarından Naive Bayes, Lojistik Regresyon, Rastgele Orman, K-En Yakın Komşu ve Destek Vektör Makineleri olmak üzere beş farklı sınıflandırma yöntemi kullanılarak, oluşturulan modellerin başarı performansları karşılaştırılmıştır. Bu çalışmada, denetimli makine öğrenmesi algoritmaları kullanılarak kalp hastalığı tahminini en iyi yapabilecek modeli belirlemek amaçlanmıştır. Bireylerde kalp hastalığı olma ihtimalini etkileyebilecek olası risk faktörleri incelenmiştir. Çalışmadaki temel hedeflerden biri sınıflandırma yöntemlerinin güvenilirliğini ve tahminsel doğruluğunu arttırmaktır. Bu amaçla veri setine Bootstrap yeniden örnekleme metodu uygulanmıştır. Kullanılan her bir sınıflandırma yönteminin başarısı ham veri ve örneklemler üzerinde model performans ölçütleri ile karşılaştırılmıştır. En başarılı modeli Rastgele Orman algoritmasının oluşturduğu görülmüştür.
Özet (Çeviri)
In the field of health, large data piles are formed with the recording of data for many years. Data stacks can be classified and made more understandable with using machine learning methods. These methods also allow the estimation of many disease diagnoses. In this study, various of risk factors for early diagnosis of Cardiovascular Disease, which is currently leading couse of death globally, were evaluated. Early diagnosis of the disease carries great importance in the field of health because it accelerates the treatment process. The dataset used in this study, consists of data accumulate under 11 common features from 5 different datasets of the“UCI Machine Learning Repository”database obtained through the Kaggle platform. In this study, the success performances of the models created by using fice different classification methods, namely Naive Bayes, Logistics Regression, Random Forest, K-Nearest Neighbors and Support Vector Machines, which are machine learning classification algorithms, were compared. In this study, it is aimed to determine the model that can best predict heart desease by using supervised machine learning algorithms. Possible risk factors that may affect the probability of having heart disease in individuals were examined. One of the main goals of the study is to increase the reliability and predictive accuracy of the classification methods. For this purpose, Bootstrap resampling method has been applied to the data set. The success of each classificassion method that is used, has been compared with the model performance measures on raw data and samples. It has been seen that the most successful model is the Random Forest algorithm.
Benzer Tezler
- Prediction of COVID 19 disease using chest X-ray images based on deep learning
Derin öğrenmeye dayalı göğüs röntgen görüntüleri kullanarak COVID 19 hastalığının tahmini
ISMAEL ABDULLAH MOHAMMED AL-RAWE
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. ADEM TEKEREK
- Makine öğrenmesi algoritmaları kullanılarak sağlık sisteminde tahmin çalışması
Prediction study using machine learning algorithms in health system
GÜLSÜM SALTAN YAŞLI
Yüksek Lisans
Türkçe
2024
Endüstri ve Endüstri MühendisliğiSakarya ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. SEHER ARSLANKAYA
- Short term electricity load forecasting with deep learning
Derin öğrenme ile kısa dönemli elektrik yük talep tahmini
İBRAHİM YAZICI
Doktora
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ÖMER FARUK BEYCA
- Feasibility analysis based on advanced deep learning techniques in integrating renewable energy resources into microgrids
Yenilenebilir enerji kaynaklarının mikroşebekelere entegre edilmesinde gelişmiş derin öğrenme tekniklerine dayalı uygulanılabilirlik analizi
FATHI FARAH FADOUL FATHI FARAH FADOUL
Doktora
İngilizce
2024
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektrik Mühendisliği Ana Bilim Dalı
DOÇ. DR. RAMAZAN ÇAĞLAR
- Train set complexity tunning for imbalance learning
Dengesiz öğrenme için eğitim seti karmaşıklığının ayarlanması
MEHMET ULAŞ
Yüksek Lisans
İngilizce
2024
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DR. MEHMET ALİ ERGÜN