Geri Dön

Ağaç temelli makine öğrenmesi yöntemlerinin karşılaştırılması ve hastalık tanısı için uygulanması

Comparison of tree-based machine learning methods and its application to diagnosis

  1. Tez No: 693042
  2. Yazar: YUNUS EMRE CEYLAN
  3. Danışmanlar: DOÇ. DR. ERALP DOĞU
  4. Tez Türü: Yüksek Lisans
  5. Konular: İstatistik, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2021
  8. Dil: Türkçe
  9. Üniversite: Muğla Sıtkı Koçman Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 90

Özet

Bu çalışmanın amacı, tiroit hastalığının teşhisinde ağaç temelli makine öğrenmesi algoritmalarının kullanımı potansiyelinin araştırılmasıdır. Bu amaçla, Muğla Sıtkı Koçman Üniversitesi Tıp Fakültesi Hastanesi'nde toplanan kronik otoimmün tiroit veri seti ve University of California Irvine Machine Learning Repository sitesinden çekilen açık veri seti kullanılmıştır. Dengesiz dağılım gösteren kronik otoimmün tiroit veri setine sentetik azınlık aşırı örnekleme tekniği (SMOTE) uygulanmıştır. Veri setlerine beş farklı sınıflandırma yöntemi uygulanmıştır. Uygulanan sınıflandırma yöntemleri C5.0 karar ağacı algoritması, CART karar ağacı algoritması, CTREE karar ağacı algoritması, rastgele orman ve xgboost yöntemleridir. Uygulamada açık kaynak kodlu R programlama dili kütüphaneleri kullanılmıştır. Sınıflandırma yöntemlerinin performanslarını değerlendirmek için karmaşıklık matrisinden faydalanılmış ve karmaşıklık matrisi yardımı ile her bir model için doğruluk, doğruluk için güven aralığı, hassasiyet, kesinlik, özgüllük, F skor değeri ve kappa istatistiği değerleri hesaplanmıştır. Bu sonuçların ışığında en iyi sonucu veren teknikler belirtilmiştir. Ayrıca modeller karar kuralları açısından değerlendirilmiştir. Böylece, hem yüksek performans gösteren hem de yorumlaması basit olan yöntemler incelenmiştir.

Özet (Çeviri)

The aim of this study is to investigate the potential of using tree-based machine learning algorithms in the diagnosis of thyroid disease. For this purpose, the chronic autoimmune thyroid dataset collected at Muğla Sıtkı Koçman University Medical Faculty Hospital and the open dataset from the University of California Irvine Machine Learning Repository were used. Synthetic minority oversampling technique (SMOTE) was applied to the imbalanced chronic autoimmune thyroid dataset. Five different classification methods were applied to the data sets. The applied classification methods are C5.0 decision tree algorithm, CART decision tree algorithm, CTREE decision tree algorithm, random forest and xgboost methods. Open source R programming language libraries were used in the application. The confusion matrix was used to evaluate the performance of the classification methods based on accuracy, confidence interval for accuracy, sensitivity, precision, specificity, F score value and kappa statistics. In the light of these results, the techniques that gave the best results are specified. In addition, the models were evaluated in terms of decision rules. Thus, methods that are both high-performing and simple to interpret were examined.

Benzer Tezler

  1. Mobil cihazlar için aktivite tanıma tabanlı adaptif kullanıcı arayüzü

    Adaptive user interface for mobile devices based on activity recognition

    ÖZLEM YURDAKURBAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ GÖKHAN İNCE

  2. Ağaç temelli makine öğrenmesi yöntemleri ile kredi risk analizi

    Credit risk analysis using tree based machine learning methods

    SAFA BOZKURT COŞKUN

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    İstatistikİstanbul Ticaret Üniversitesi

    İstatistik Ana Bilim Dalı

    PROF. DR. MÜNEVVER TURANLI

  3. Makine öğrenmesi teknikleri ile tahsilat davranışı tahmini: telekomünikasyon sektörü örneği

    Prediction of debt collection behaviour with machine learning techniques: A case study on telecommunication company customers

    ELİF EKİZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DOÇ. DR. BAŞAR ÖZTAYŞİ

  4. Kombinatoryal optimizasyon problemlerinin çözümünde makine öğrenmesi temelli yaklaşımlar

    Machine learning based approaches in combinatorial optimization problems

    DUYGU SELİN TURAN

    Doktora

    Türkçe

    Türkçe

    2023

    MatematikEge Üniversitesi

    Matematik Ana Bilim Dalı

    PROF. DR. BURAK ORDİN

  5. A new agro-meteorological drought index based on remote sensing

    Uzaktan algılama temelli yeni bir agro-meteorolojik kuraklık indeksi

    EYYUP ENSAR BAŞAKIN

    Doktora

    İngilizce

    İngilizce

    2024

    İnşaat Mühendisliğiİstanbul Teknik Üniversitesi

    İnşaat Mühendisliği Ana Bilim Dalı

    PROF. DR. MEHMET CÜNEYD DEMİREL