Sınıflandırma problemlerinde topluluk öğrenme yöntemlerinin incelenmesi ve küçük hücreli dışı akciğer kanseri verileri üzerine bir uygulaması
Examination of ensemble learning methods in classification problems and an application on non-small cell lung cancer data
- Tez No: 660140
- Danışmanlar: PROF. DR. CEMİL ÇOLAK
- Tez Türü: Doktora
- Konular: Biyoistatistik, Biostatistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2020
- Dil: Türkçe
- Üniversite: İnönü Üniversitesi
- Enstitü: Sağlık Bilimleri Enstitüsü
- Ana Bilim Dalı: Biyoistatistik ve Tıp Bilişimi Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 80
Özet
Amaç: Bu çalışmanın amacı, yapay zekâya dayalı topluluk öğrenme yöntemlerinin tıpta kullanılabilirliğini araştırılmak ve geliştirmektir. KHDAK ölüm durumunu sınıflandırmak için çeşitli klinik değişkenleri içeren veri seti kullanılarak, KHDAK değişkeni; yanıt/çıktı/hedef ve veri setinde yer alan ölçümler ile diğer faktörler açıklayıcı/tahminleyici/bağımsız değişkenler olmak üzere, topluluk öğrenme yöntemlerinin KHDAK değişkenini sınıflandırmadaki performansı incelenecek ve en iyi model belirlenecektir. Materyal ve Metot: Bu çalışma, adresli açık kaynak erişimli web sitesinde yer alan KHDAK hastaları ölüm durumunu sınıflandırmak için çeşitli klinik değişkenleri içeren veri setini kullanarak yapılmıştır. Veri seti toplam 181 inoperabl evre I-IIIB KHDAK hasta kaydını içermektedir. Veri setinin yaklaşık % 55.2'si radyoterapi yada kemoterapi alan hastalardan oluşurken % 44.8'i radikal tedavi gören hastalardan oluşmaktadır. Makine öğrenme yöntemlerinden olan SMO, K-NN, random forest ve XGBoost gibi bireysel sınıflandırıcılar ve performansları ile topluluk öğrenme yöntemlerinden voting, bagging, boosting ve stacking yöntemleri kullanılmıştır. Bulgular: Genel değerlendirmeye göre doğruluk, duyarlılık, kesinlik, özgüllük ve ROC eğrisi altında kalan alan metriklerinde en yüksek performansı boosting topluluk öğrenme yöntemi sağlamıştır. XGBoost ile en yüksek sınıflandırma performansını sağlayan boosting topluluk öğrenme yöntemi 0.982 doğruluk değeri, 0.971 duyarlılık değeri, 0.989 kesinlik değeri, 0.989 özgüllük değeri ve 0.998 ROC eğrisi altında kalan alan değerlerini elde etmiştir. Sonuç: Temel sınıflandırıcılara göre topluluk öğrenme sınıflandırıcıları KHDAK ölüm durumunu sınıflandırmada daha iyi sonuçlar vermiştir. Prevelansı yüksek kanser hastalıklılarında, sınıflandırma problemleri için topluluk öğrenme yöntemlerinin kullanılması başarılı sonuçların elde edilmesi açısından önerilmektedir.
Özet (Çeviri)
Aim: The aim of this study is to investigate and improve the usability of AI -based community learning methods in medicine. Using the data set including various clinical variables to classify NSCLC death status, NSCLC variable; The performance of ensemble learning methods in classifying NSCLC variable will be examined, and the best model will be determined. Material and Methods: This study was conducted using the data set containing various clinical variables to classify the death status of NSCLC patients on the addressed open source website. The data set includes a total of 181 inoperable stage I-IIIB NSCLC patients. Approximately 55.2 % of the data set consisted of patients receiving radiotherapy or chemotherapy, while 44.8 % consisted of patients receiving radical treatment. Individual classifiers such as SMO, K-NN, random forest and XGBoost, which are machine learning methods, and their performances, and voting, bagging, boosting and stacking methods from ensemble learning methods were used. Results: According to the general evaluation, the boosting ensemble learning method provided the highest performance in the metrics of accuracy, sensitivity, precision, specificity and the area under the ROC curve. The boosting ensemble learning method, which provides the highest classification performance with XGBoost, achieved 0.982 accuracy value, 0.971 sensitivity value, 0.989 precision value, 0.989 specificity value and 0.998 ROC curve. Conclusion: Ensemble learning classifiers gave better results in classifying NSCLC mortality according to the basic classifiers. It is recommended to use ensemble learning methods for classification problems in cancer patients with high prevalence in order to achieve successful results.
Benzer Tezler
- Fake news classification using machine learning and deep learning approaches
Makine öğrenimi ve derin öğrenme yaklaşımlarını kullanarak sahte haber sınıflandırması
SAJA ABDULHALEEM MAHMOOD AL-OBAIDI
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ TUBA ÇAĞLIKANTAR
- Kayıp gözlem içeren dengesiz veri setlerinin topluluk öğrenme algoritmaları ile sınıflandırılması
Classification with ensemble methods on missing and imbalanced data
ENİS GÜMÜŞTAŞ
Yüksek Lisans
Türkçe
2019
İstatistikMimar Sinan Güzel Sanatlar Üniversitesiİstatistik Ana Bilim Dalı
DOÇ. AYÇA ÇAKMAK PEHLİVANLI
- Makine öğrenmesi teknikleriyle mobil ödemede sahtekarlık tespiti
Fraud detection in mobile payment with machine learning methods
ÖZLEM GÜVEN
Yüksek Lisans
Türkçe
2021
EkonometriDokuz Eylül ÜniversitesiEkonometri Ana Bilim Dalı
DR. ÖĞR. ÜYESİ SERKAN ARAS
- Makine öğrenme problemlerinde konveks olmayan optimizasyon modellerinin iki konveks fonksiyonunun farkı ve ikinci derece konik progromlama ile modellenmesi
Difference of convex functions programming and second-order conic programming modelling of non-convex optimization problems in machine learning
DUYGU ÜÇÜNCÜ
Doktora
Türkçe
2024
MatematikYıldız Teknik ÜniversitesiMatematik Ana Bilim Dalı
PROF. DR. ERDAL GÜL
PROF. DR. SÜREYYA AKYÜZ
- Sentiment analysis model proposal with deep learning techniques on big data: Portfolio selection with the help of industry indicators
Büyük veri üzerinde derin öğrenme teknikleri ile duygu analizi model önerisi: Sektör göstergeleri yardımıyla portföy seçimi
MAHMUT SAMİ SİVRİ
Doktora
İngilizce
2023
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
PROF. DR. ALP ÜSTÜNDAĞ