Ağaç temelli makine öğrenmesi yöntemlerinin karşılaştırılması ve hastalık tanısı için uygulanması
Comparison of tree-based machine learning methods and its application to diagnosis
- Tez No: 693042
- Danışmanlar: DOÇ. DR. ERALP DOĞU
- Tez Türü: Yüksek Lisans
- Konular: İstatistik, Statistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2021
- Dil: Türkçe
- Üniversite: Muğla Sıtkı Koçman Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: İstatistik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 90
Özet
Bu çalışmanın amacı, tiroit hastalığının teşhisinde ağaç temelli makine öğrenmesi algoritmalarının kullanımı potansiyelinin araştırılmasıdır. Bu amaçla, Muğla Sıtkı Koçman Üniversitesi Tıp Fakültesi Hastanesi'nde toplanan kronik otoimmün tiroit veri seti ve University of California Irvine Machine Learning Repository sitesinden çekilen açık veri seti kullanılmıştır. Dengesiz dağılım gösteren kronik otoimmün tiroit veri setine sentetik azınlık aşırı örnekleme tekniği (SMOTE) uygulanmıştır. Veri setlerine beş farklı sınıflandırma yöntemi uygulanmıştır. Uygulanan sınıflandırma yöntemleri C5.0 karar ağacı algoritması, CART karar ağacı algoritması, CTREE karar ağacı algoritması, rastgele orman ve xgboost yöntemleridir. Uygulamada açık kaynak kodlu R programlama dili kütüphaneleri kullanılmıştır. Sınıflandırma yöntemlerinin performanslarını değerlendirmek için karmaşıklık matrisinden faydalanılmış ve karmaşıklık matrisi yardımı ile her bir model için doğruluk, doğruluk için güven aralığı, hassasiyet, kesinlik, özgüllük, F skor değeri ve kappa istatistiği değerleri hesaplanmıştır. Bu sonuçların ışığında en iyi sonucu veren teknikler belirtilmiştir. Ayrıca modeller karar kuralları açısından değerlendirilmiştir. Böylece, hem yüksek performans gösteren hem de yorumlaması basit olan yöntemler incelenmiştir.
Özet (Çeviri)
The aim of this study is to investigate the potential of using tree-based machine learning algorithms in the diagnosis of thyroid disease. For this purpose, the chronic autoimmune thyroid dataset collected at Muğla Sıtkı Koçman University Medical Faculty Hospital and the open dataset from the University of California Irvine Machine Learning Repository were used. Synthetic minority oversampling technique (SMOTE) was applied to the imbalanced chronic autoimmune thyroid dataset. Five different classification methods were applied to the data sets. The applied classification methods are C5.0 decision tree algorithm, CART decision tree algorithm, CTREE decision tree algorithm, random forest and xgboost methods. Open source R programming language libraries were used in the application. The confusion matrix was used to evaluate the performance of the classification methods based on accuracy, confidence interval for accuracy, sensitivity, precision, specificity, F score value and kappa statistics. In the light of these results, the techniques that gave the best results are specified. In addition, the models were evaluated in terms of decision rules. Thus, methods that are both high-performing and simple to interpret were examined.
Benzer Tezler
- Mobil cihazlar için aktivite tanıma tabanlı adaptif kullanıcı arayüzü
Adaptive user interface for mobile devices based on activity recognition
ÖZLEM YURDAKURBAN
Yüksek Lisans
Türkçe
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ GÖKHAN İNCE
- Farklı mutasyon stratejileri kullanılarak XML temelli sistemlerde güvenlik zafiyetlerinin fuzz testi ile tespiti
Detection of security vulnerabilities in XML-based systems with fuzz testing using different mutation strategies
ŞERAFETTİN ŞENTÜRK
Doktora
Türkçe
2025
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. NEJAT YUMUŞAK
DR. VAHİD GAROUSİ
- Makine öğrenmesi yöntemleri kullanılarak gayrimenkul değer tahmininde coğrafi referanslı verinin katkısı
Contribution of geo-referenced data in real estate value prediction using machine learning methods
MUSTAFA DENİZ AYAR
Yüksek Lisans
Türkçe
2024
Jeodezi ve FotogrametriYıldız Teknik ÜniversitesiHarita Mühendisliği Ana Bilim Dalı
DOÇ. DR. ALPER ŞEN
- Ağaç temelli makine öğrenmesi yöntemleri ile kredi risk analizi
Credit risk analysis using tree based machine learning methods
SAFA BOZKURT COŞKUN
Yüksek Lisans
Türkçe
2023
İstatistikİstanbul Ticaret Üniversitesiİstatistik Ana Bilim Dalı
PROF. DR. MÜNEVVER TURANLI
- Makine öğrenmesi teknikleri ile tahsilat davranışı tahmini: telekomünikasyon sektörü örneği
Prediction of debt collection behaviour with machine learning techniques: A case study on telecommunication company customers
ELİF EKİZ
Yüksek Lisans
Türkçe
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. BAŞAR ÖZTAYŞİ