Geri Dön

Sınıflandırma problemlerinde topluluk öğrenme yöntemlerinin incelenmesi ve küçük hücreli dışı akciğer kanseri verileri üzerine bir uygulaması

Examination of ensemble learning methods in classification problems and an application on non-small cell lung cancer data

  1. Tez No: 660140
  2. Yazar: MEHMET KIVRAK
  3. Danışmanlar: PROF. DR. CEMİL ÇOLAK
  4. Tez Türü: Doktora
  5. Konular: Biyoistatistik, Biostatistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2020
  8. Dil: Türkçe
  9. Üniversite: İnönü Üniversitesi
  10. Enstitü: Sağlık Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Biyoistatistik ve Tıp Bilişimi Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 80

Özet

Amaç: Bu çalışmanın amacı, yapay zekâya dayalı topluluk öğrenme yöntemlerinin tıpta kullanılabilirliğini araştırılmak ve geliştirmektir. KHDAK ölüm durumunu sınıflandırmak için çeşitli klinik değişkenleri içeren veri seti kullanılarak, KHDAK değişkeni; yanıt/çıktı/hedef ve veri setinde yer alan ölçümler ile diğer faktörler açıklayıcı/tahminleyici/bağımsız değişkenler olmak üzere, topluluk öğrenme yöntemlerinin KHDAK değişkenini sınıflandırmadaki performansı incelenecek ve en iyi model belirlenecektir. Materyal ve Metot: Bu çalışma, adresli açık kaynak erişimli web sitesinde yer alan KHDAK hastaları ölüm durumunu sınıflandırmak için çeşitli klinik değişkenleri içeren veri setini kullanarak yapılmıştır. Veri seti toplam 181 inoperabl evre I-IIIB KHDAK hasta kaydını içermektedir. Veri setinin yaklaşık % 55.2'si radyoterapi yada kemoterapi alan hastalardan oluşurken % 44.8'i radikal tedavi gören hastalardan oluşmaktadır. Makine öğrenme yöntemlerinden olan SMO, K-NN, random forest ve XGBoost gibi bireysel sınıflandırıcılar ve performansları ile topluluk öğrenme yöntemlerinden voting, bagging, boosting ve stacking yöntemleri kullanılmıştır. Bulgular: Genel değerlendirmeye göre doğruluk, duyarlılık, kesinlik, özgüllük ve ROC eğrisi altında kalan alan metriklerinde en yüksek performansı boosting topluluk öğrenme yöntemi sağlamıştır. XGBoost ile en yüksek sınıflandırma performansını sağlayan boosting topluluk öğrenme yöntemi 0.982 doğruluk değeri, 0.971 duyarlılık değeri, 0.989 kesinlik değeri, 0.989 özgüllük değeri ve 0.998 ROC eğrisi altında kalan alan değerlerini elde etmiştir. Sonuç: Temel sınıflandırıcılara göre topluluk öğrenme sınıflandırıcıları KHDAK ölüm durumunu sınıflandırmada daha iyi sonuçlar vermiştir. Prevelansı yüksek kanser hastalıklılarında, sınıflandırma problemleri için topluluk öğrenme yöntemlerinin kullanılması başarılı sonuçların elde edilmesi açısından önerilmektedir.

Özet (Çeviri)

Aim: The aim of this study is to investigate and improve the usability of AI -based community learning methods in medicine. Using the data set including various clinical variables to classify NSCLC death status, NSCLC variable; The performance of ensemble learning methods in classifying NSCLC variable will be examined, and the best model will be determined. Material and Methods: This study was conducted using the data set containing various clinical variables to classify the death status of NSCLC patients on the addressed open source website. The data set includes a total of 181 inoperable stage I-IIIB NSCLC patients. Approximately 55.2 % of the data set consisted of patients receiving radiotherapy or chemotherapy, while 44.8 % consisted of patients receiving radical treatment. Individual classifiers such as SMO, K-NN, random forest and XGBoost, which are machine learning methods, and their performances, and voting, bagging, boosting and stacking methods from ensemble learning methods were used. Results: According to the general evaluation, the boosting ensemble learning method provided the highest performance in the metrics of accuracy, sensitivity, precision, specificity and the area under the ROC curve. The boosting ensemble learning method, which provides the highest classification performance with XGBoost, achieved 0.982 accuracy value, 0.971 sensitivity value, 0.989 precision value, 0.989 specificity value and 0.998 ROC curve. Conclusion: Ensemble learning classifiers gave better results in classifying NSCLC mortality according to the basic classifiers. It is recommended to use ensemble learning methods for classification problems in cancer patients with high prevalence in order to achieve successful results.

Benzer Tezler

  1. Fake news classification using machine learning and deep learning approaches

    Makine öğrenimi ve derin öğrenme yaklaşımlarını kullanarak sahte haber sınıflandırması

    SAJA ABDULHALEEM MAHMOOD AL-OBAIDI

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ TUBA ÇAĞLIKANTAR

  2. Kayıp gözlem içeren dengesiz veri setlerinin topluluk öğrenme algoritmaları ile sınıflandırılması

    Classification with ensemble methods on missing and imbalanced data

    ENİS GÜMÜŞTAŞ

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    İstatistikMimar Sinan Güzel Sanatlar Üniversitesi

    İstatistik Ana Bilim Dalı

    DOÇ. AYÇA ÇAKMAK PEHLİVANLI

  3. Makine öğrenmesi teknikleriyle mobil ödemede sahtekarlık tespiti

    Fraud detection in mobile payment with machine learning methods

    ÖZLEM GÜVEN

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    EkonometriDokuz Eylül Üniversitesi

    Ekonometri Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ SERKAN ARAS

  4. Makine öğrenme problemlerinde konveks olmayan optimizasyon modellerinin iki konveks fonksiyonunun farkı ve ikinci derece konik progromlama ile modellenmesi

    Difference of convex functions programming and second-order conic programming modelling of non-convex optimization problems in machine learning

    DUYGU ÜÇÜNCÜ

    Doktora

    Türkçe

    Türkçe

    2024

    MatematikYıldız Teknik Üniversitesi

    Matematik Ana Bilim Dalı

    PROF. DR. ERDAL GÜL

    PROF. DR. SÜREYYA AKYÜZ

  5. Sentiment analysis model proposal with deep learning techniques on big data: Portfolio selection with the help of industry indicators

    Büyük veri üzerinde derin öğrenme teknikleri ile duygu analizi model önerisi: Sektör göstergeleri yardımıyla portföy seçimi

    MAHMUT SAMİ SİVRİ

    Doktora

    İngilizce

    İngilizce

    2023

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    PROF. DR. ALP ÜSTÜNDAĞ