Bulanık çıkarsama sistemleri ile veri madenciliği yöntemlerinin sınıflama performansının benzetim çalışması ile karşılaştırılması ve sağlık alanında uygulanması
A comparison of classification performance of fuzzy inference system with data mining methods using simulation study and application in medicine
- Tez No: 473687
- Danışmanlar: DOÇ. DR. SERDAL KENAN KÖSE
- Tez Türü: Yüksek Lisans
- Konular: Biyoistatistik, Biostatistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2017
- Dil: Türkçe
- Üniversite: Ankara Üniversitesi
- Enstitü: Sağlık Bilimleri Enstitüsü
- Ana Bilim Dalı: Biyoistatistik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 72
Özet
Sınıflandırma, veri setinde her gözlem için hedef sınıfı doğru tahmin etmeyi amaçlayan veri madenciliğinin en önemli araştırma konularından birisidir. Sınıflandırma işleminde sistemin eğitim verisi üzerinden öğrenmesi ve benzer bir veri seti ile karşılaşması halinde o verinin ait olacağı sınıfı tahmin etmesi sağlanır. Bilgisayar sistemlerinde öğrenme iki şekilde olabilir: veriden öğrenme ve uzmandan öğrenme. Elde veri olması halinde makine öğrenmesi yöntemleri ile gerekli çıkarsamaları yapmak olası iken, elde veri olmadığı durumlarda uzman görüşünden yararlanan yöntemlere başvurulmalıdır. Bu tez çalışmasında uzmandan öğrenen bulanık çıkarsama sistemleri ile veriden öğrenen veri madenciliği yöntemlerinin farklı örnek büyüklüklerinde (100, 250, 500, 1000) sınıflandırma performansları karşılaştırılmıştır. Karşılaştırmada kullanılan veri madenciliği algoritmaları literatürde sıklıkla karşılaşılan sınıflandırıcılar olan, Yapay Sinir Ağları, Random Forest ve Destek Vektör Makinesi'dir. Değerlendirmelerde, sınıflandırma performans ölçütleri olarak doğruluk, kesinlik, duyarlılık ve F-ölçütü kullanılmıştır. Bu çalışmada, University of California Irvine (UCI) makine öğrenmesi veritabanında yer alan kalp hastalığı verisinin özellikleri korunarak değişken önemine göre belirlenen 6 bağımsız değişken (cinsiyet, göğüs ağrı tipi, maksimum kalp atım hızı, egzersizin neden olduğu anjin, oldpeak ve ana damar sayısı) için üretilen veriler kullanılmıştır. Çalışma sonucunda, veri madenciliği yöntemlerinden biri olan Yapay Sinir Ağları ve Bulanık Çıkarsama Sistemleri benzer sonuçlar vermiştir ve Random Forest ve Destek Vektör Makinesi yöntemlerine göre daha iyi sınıflama performansı göstermişlerdir.
Özet (Çeviri)
Classification is one of the most important research topics of data mining aimed to accurately predict the target class for each case in the data. In classification process, it is provided that the system learns from training data and, when confronted a similar dataset, predicts the class in which the dataset should be. In computer systems, learning can be done in two ways: learning from the data and learning from the expert. When data is available, it is possible to make the necessary inferences with machine learning methods, otherwise methods that benefit from expert opinion should be used. In this thesis study, classification performances of fuzzy inference systems that learn from experts and data mining methods that learn from the data are compared in different sample sizes (100, 250, 500, 1000). The data mining algorithms used in the comparison are Artificial Neural Networks, Random Forest, Support Vector Machine, which are frequently encountered classifiers in the literature. In the evaluations, accuracy, precision, sensitivity and F-criterion were used as classification performance measures. In this study, data were generated for 6 independent variables (sex, chest pain type, max heart rate, exercise induced, oldpeak and major vessels) determined by variable importance, preserving the characteristics of heart disease data in the University of California Irvine (UCI) machine learning database. In conclusion, Artificial neural networks, one of the methods of data mining, and Fuzzy Inference Systems have similar results and also have better classification performance than Random Forest and Support Vector Machine.
Benzer Tezler
- Yazılım kusur kestirimi eklentisinin esnek hesaplama yöntemleri ile tasarımı ve geliştirimi: kapsamlı metrik değerlendirilmesi
Design and implementation of software fault prediction plugin by using soft computing methods: comprehensive metric assessment
EZGİ ERTÜRK GÜLER
Doktora
Türkçe
2016
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. EBRU SEZER
- Application of defuzzification-free hierarchical fuzzy inference rule generation method to software fault prediction problems and fuzzy rule discussion
Durulaştırmasız hiyerarşik bulanık çıkarsama kural üretme yönteminin yazılım hata kestirimi problemlerine uygulanması ve bulanık kural tartışması
NAZLI ECE UYKUR
Yüksek Lisans
İngilizce
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. EBRU AKÇAPINAR SEZER
- Tanecikli hesaplama yöntemi ile kavram çözümleme
Concept analysis with granular computing method
MERT BAL
Doktora
Türkçe
2008
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik ÜniversitesiMatematik Mühendisliği Ana Bilim Dalı
PROF. DR. HAYRİ SEVER
PROF. DR. OYA KALIPSIZ
- Hiyerarşik bulanık çıkarsama sistemlerinde bulanıklığın düzeyler arası aktarımı için yöntem önerisi
A method suggestion for transition of fuzziness between sublayers in hierarchical fuzzy systems
BEGÜM MUTLU
Yüksek Lisans
Türkçe
2014
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. EBRU SEZER
YRD. DOÇ. DR. HAKAN AHMET NEFESLİOĞLU
- Development of a STEP feature-based intelligent process planning system for prismatic parts
Prizmatik parçalar için STEP unsur-tabanlı akıllı süreç planlama sisteminin geliştirilmesi
SALEH AMAİTİK
Doktora
İngilizce
2005
Makine MühendisliğiOrta Doğu Teknik ÜniversitesiMakine Mühendisliği Bölümü
PROF.DR. ENGİN KILIÇ