Sınıflandırma problemlerinde topluluk öğrenme yöntemlerinin incelenmesi ve küçük hücreli dışı akciğer kanseri verileri üzerine bir uygulaması

Examination of ensemble learning methods in classification problems and an application on non-small cell lung cancer data

PDF İndir

Tez No: 660140
Yazar: MEHMET KIVRAK
Danışmanlar: PROF. DR. CEMİL ÇOLAK
Tez Türü: Doktora
Konular: Biyoistatistik, Biostatistics
Anahtar Kelimeler: Belirtilmemiş.
Yıl: 2020
Dil: Türkçe
Üniversite: İnönü Üniversitesi
Enstitü: Sağlık Bilimleri Enstitüsü
Ana Bilim Dalı: Biyoistatistik ve Tıp Bilişimi Ana Bilim Dalı
Bilim Dalı: Belirtilmemiş.
Sayfa Sayısı: 80

Özet

Amaç: Bu çalışmanın amacı, yapay zekâya dayalı topluluk öğrenme yöntemlerinin tıpta kullanılabilirliğini araştırılmak ve geliştirmektir. KHDAK ölüm durumunu sınıflandırmak için çeşitli klinik değişkenleri içeren veri seti kullanılarak, KHDAK değişkeni; yanıt/çıktı/hedef ve veri setinde yer alan ölçümler ile diğer faktörler açıklayıcı/tahminleyici/bağımsız değişkenler olmak üzere, topluluk öğrenme yöntemlerinin KHDAK değişkenini sınıflandırmadaki performansı incelenecek ve en iyi model belirlenecektir. Materyal ve Metot: Bu çalışma, adresli açık kaynak erişimli web sitesinde yer alan KHDAK hastaları ölüm durumunu sınıflandırmak için çeşitli klinik değişkenleri içeren veri setini kullanarak yapılmıştır. Veri seti toplam 181 inoperabl evre I-IIIB KHDAK hasta kaydını içermektedir. Veri setinin yaklaşık % 55.2'si radyoterapi yada kemoterapi alan hastalardan oluşurken % 44.8'i radikal tedavi gören hastalardan oluşmaktadır. Makine öğrenme yöntemlerinden olan SMO, K-NN, random forest ve XGBoost gibi bireysel sınıflandırıcılar ve performansları ile topluluk öğrenme yöntemlerinden voting, bagging, boosting ve stacking yöntemleri kullanılmıştır. Bulgular: Genel değerlendirmeye göre doğruluk, duyarlılık, kesinlik, özgüllük ve ROC eğrisi altında kalan alan metriklerinde en yüksek performansı boosting topluluk öğrenme yöntemi sağlamıştır. XGBoost ile en yüksek sınıflandırma performansını sağlayan boosting topluluk öğrenme yöntemi 0.982 doğruluk değeri, 0.971 duyarlılık değeri, 0.989 kesinlik değeri, 0.989 özgüllük değeri ve 0.998 ROC eğrisi altında kalan alan değerlerini elde etmiştir. Sonuç: Temel sınıflandırıcılara göre topluluk öğrenme sınıflandırıcıları KHDAK ölüm durumunu sınıflandırmada daha iyi sonuçlar vermiştir. Prevelansı yüksek kanser hastalıklılarında, sınıflandırma problemleri için topluluk öğrenme yöntemlerinin kullanılması başarılı sonuçların elde edilmesi açısından önerilmektedir.

Özet (Çeviri)

Aim: The aim of this study is to investigate and improve the usability of AI -based community learning methods in medicine. Using the data set including various clinical variables to classify NSCLC death status, NSCLC variable; The performance of ensemble learning methods in classifying NSCLC variable will be examined, and the best model will be determined. Material and Methods: This study was conducted using the data set containing various clinical variables to classify the death status of NSCLC patients on the addressed open source website. The data set includes a total of 181 inoperable stage I-IIIB NSCLC patients. Approximately 55.2 % of the data set consisted of patients receiving radiotherapy or chemotherapy, while 44.8 % consisted of patients receiving radical treatment. Individual classifiers such as SMO, K-NN, random forest and XGBoost, which are machine learning methods, and their performances, and voting, bagging, boosting and stacking methods from ensemble learning methods were used. Results: According to the general evaluation, the boosting ensemble learning method provided the highest performance in the metrics of accuracy, sensitivity, precision, specificity and the area under the ROC curve. The boosting ensemble learning method, which provides the highest classification performance with XGBoost, achieved 0.982 accuracy value, 0.971 sensitivity value, 0.989 precision value, 0.989 specificity value and 0.998 ROC curve. Conclusion: Ensemble learning classifiers gave better results in classifying NSCLC mortality according to the basic classifiers. It is recommended to use ensemble learning methods for classification problems in cancer patients with high prevalence in order to achieve successful results.

Benzer Tezler

Tez No
847173
Fake news classification using machine learning and deep learning approaches
Makine öğrenimi ve derin öğrenme yaklaşımlarını kullanarak sahte haber sınıflandırması
SAJA ABDULHALEEM MAHMOOD AL-OBAIDI
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Gazi Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ TUBA ÇAĞLIKANTAR
Tez No
937282
Hiperspektral görüntü analizi ile olağan dışı durum ve hedef tespiti
Anomaly and target detection with hyperspectral image analysis
GÜRCAN LOKMAN
Doktora
Türkçe
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Marmara Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. VEDAT TOPUZ
DR. ÖĞR. ÜYESİ HASAN HÜSEYİN ÇELİK
Tez No
562198
Kayıp gözlem içeren dengesiz veri setlerinin topluluk öğrenme algoritmaları ile sınıflandırılması
Classification with ensemble methods on missing and imbalanced data
ENİS GÜMÜŞTAŞ
Yüksek Lisans
Türkçe
2019
İstatistik Mimar Sinan Güzel Sanatlar Üniversitesi
İstatistik Ana Bilim Dalı
DOÇ. AYÇA ÇAKMAK PEHLİVANLI
Tez No
665885
Makine öğrenmesi teknikleriyle mobil ödemede sahtekarlık tespiti
Fraud detection in mobile payment with machine learning methods
ÖZLEM GÜVEN
Yüksek Lisans
Türkçe
2021
Ekonometri Dokuz Eylül Üniversitesi
Ekonometri Ana Bilim Dalı
DR. ÖĞR. ÜYESİ SERKAN ARAS
Tez No
858033
Makine öğrenme problemlerinde konveks olmayan optimizasyon modellerinin iki konveks fonksiyonunun farkı ve ikinci derece konik progromlama ile modellenmesi
Difference of convex functions programming and second-order conic programming modelling of non-convex optimization problems in machine learning
DUYGU ÜÇÜNCÜ
Doktora
Türkçe
2024
Matematik Yıldız Teknik Üniversitesi
Matematik Ana Bilim Dalı
PROF. DR. ERDAL GÜL
PROF. DR. SÜREYYA AKYÜZ

Geri Dön