Ağaç temelli makine öğrenmesi yöntemlerinin karşılaştırılması ve hastalık tanısı için uygulanması
Comparison of tree-based machine learning methods and its application to diagnosis
- Tez No: 693042
- Danışmanlar: DOÇ. DR. ERALP DOĞU
- Tez Türü: Yüksek Lisans
- Konular: İstatistik, Statistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2021
- Dil: Türkçe
- Üniversite: Muğla Sıtkı Koçman Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: İstatistik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 90
Özet
Bu çalışmanın amacı, tiroit hastalığının teşhisinde ağaç temelli makine öğrenmesi algoritmalarının kullanımı potansiyelinin araştırılmasıdır. Bu amaçla, Muğla Sıtkı Koçman Üniversitesi Tıp Fakültesi Hastanesi'nde toplanan kronik otoimmün tiroit veri seti ve University of California Irvine Machine Learning Repository sitesinden çekilen açık veri seti kullanılmıştır. Dengesiz dağılım gösteren kronik otoimmün tiroit veri setine sentetik azınlık aşırı örnekleme tekniği (SMOTE) uygulanmıştır. Veri setlerine beş farklı sınıflandırma yöntemi uygulanmıştır. Uygulanan sınıflandırma yöntemleri C5.0 karar ağacı algoritması, CART karar ağacı algoritması, CTREE karar ağacı algoritması, rastgele orman ve xgboost yöntemleridir. Uygulamada açık kaynak kodlu R programlama dili kütüphaneleri kullanılmıştır. Sınıflandırma yöntemlerinin performanslarını değerlendirmek için karmaşıklık matrisinden faydalanılmış ve karmaşıklık matrisi yardımı ile her bir model için doğruluk, doğruluk için güven aralığı, hassasiyet, kesinlik, özgüllük, F skor değeri ve kappa istatistiği değerleri hesaplanmıştır. Bu sonuçların ışığında en iyi sonucu veren teknikler belirtilmiştir. Ayrıca modeller karar kuralları açısından değerlendirilmiştir. Böylece, hem yüksek performans gösteren hem de yorumlaması basit olan yöntemler incelenmiştir.
Özet (Çeviri)
The aim of this study is to investigate the potential of using tree-based machine learning algorithms in the diagnosis of thyroid disease. For this purpose, the chronic autoimmune thyroid dataset collected at Muğla Sıtkı Koçman University Medical Faculty Hospital and the open dataset from the University of California Irvine Machine Learning Repository were used. Synthetic minority oversampling technique (SMOTE) was applied to the imbalanced chronic autoimmune thyroid dataset. Five different classification methods were applied to the data sets. The applied classification methods are C5.0 decision tree algorithm, CART decision tree algorithm, CTREE decision tree algorithm, random forest and xgboost methods. Open source R programming language libraries were used in the application. The confusion matrix was used to evaluate the performance of the classification methods based on accuracy, confidence interval for accuracy, sensitivity, precision, specificity, F score value and kappa statistics. In the light of these results, the techniques that gave the best results are specified. In addition, the models were evaluated in terms of decision rules. Thus, methods that are both high-performing and simple to interpret were examined.
Benzer Tezler
- Mobil cihazlar için aktivite tanıma tabanlı adaptif kullanıcı arayüzü
Adaptive user interface for mobile devices based on activity recognition
ÖZLEM YURDAKURBAN
Yüksek Lisans
Türkçe
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ GÖKHAN İNCE
- Ağaç temelli makine öğrenmesi yöntemleri ile kredi risk analizi
Credit risk analysis using tree based machine learning methods
SAFA BOZKURT COŞKUN
Yüksek Lisans
Türkçe
2023
İstatistikİstanbul Ticaret Üniversitesiİstatistik Ana Bilim Dalı
PROF. DR. MÜNEVVER TURANLI
- Makine öğrenmesi teknikleri ile tahsilat davranışı tahmini: telekomünikasyon sektörü örneği
Prediction of debt collection behaviour with machine learning techniques: A case study on telecommunication company customers
ELİF EKİZ
Yüksek Lisans
Türkçe
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. BAŞAR ÖZTAYŞİ
- Kombinatoryal optimizasyon problemlerinin çözümünde makine öğrenmesi temelli yaklaşımlar
Machine learning based approaches in combinatorial optimization problems
DUYGU SELİN TURAN
- A new agro-meteorological drought index based on remote sensing
Uzaktan algılama temelli yeni bir agro-meteorolojik kuraklık indeksi
EYYUP ENSAR BAŞAKIN
Doktora
İngilizce
2024
İnşaat Mühendisliğiİstanbul Teknik Üniversitesiİnşaat Mühendisliği Ana Bilim Dalı
PROF. DR. MEHMET CÜNEYD DEMİREL