Veri madenciliği sınıflandırma yöntemlerinden karar ağaçları ve bir uygulama
Data mining classification method decision trees and an application
- Tez No: 582493
- Danışmanlar: DR. ÖĞR. ÜYESİ YUNUS AKDOĞAN
- Tez Türü: Yüksek Lisans
- Konular: İstatistik, Statistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2019
- Dil: Türkçe
- Üniversite: Selçuk Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: İstatistik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 55
Özet
Bilişim teknolojisi çok büyük miktarlardaki veriyi saklamayı mümkün kılmaktadır. Biriken veri üzerinde analizler yapmak amacıyla çeşitli matematiksel ve istatistiksel yöntemler kullanılabilmektedir. Fakat veri miktarı arttıkça sorunlar ortaya çıkmaktadır. Bu veriyi yönetmek ve veriyi çözümleyerek“yararlı bilgiye”erişilmesini sağlayabilmek için veri madenciliği yöntemi geliştirilmiştir. Veri madenciliği, en basit tanımıyla, toplanan veriyi bilgiye dönüştürme tekniklerinin bütünüdür. Madencilik teriminin kullanılmasının nedeni ise, büyük miktarda verinin içerisinden bilgiye dönüşecek uygun veriyi arama işleminin maden arama işiyle benzerlik göstermesidir. Bu çalışmanın önemi; günümüzde oldukça önemli ve de ihtiyaç duyulan bir alan haline gelen veri madenciliğinin sınıflandırma yöntemlerinden olan karar ağaçlarını derinlemesine ele alıyor olmasıdır. Karar ağaçlarında, değişken tiplerine göre farklı algoritmalar kullanılabilmektedir. C5.0, CART ve CHAID en popüler algoritmalardır. Bu çalışmada da, C5.0, CART ve CHAID algoritmaları derinlemesine incelenmiştir. The UCI Machine Learning Repository veritabanından temin edilen mantar veri setinde yer alan her bir gözlem, veri madenciliği sınıflandırma yöntemlerinden karar ağaçları algoritmaları kullanılarak zehirli veya yenilebilir şeklinde sınıflandırılmaya çalışılmıştır.
Özet (Çeviri)
Information technology makes it possible to store huge amounts of data. Various mathematical and statistical methods can be used to analyze the accumulated data. However, as the amount of data increases, problems arise. Data mining method has been developed to manage this data and provide accessibility to“useful information”via analyzing the data. Data mining, in its simplest definition, is a collection of techniques for converting collected data into information. The reason for using the term mining is that the process of searching for the appropriate data to be transformed into information from a large amount of data is similar to that of mining. The importance of this study; the fact that data mining, which has become a very important and needed field in today's world, covers the decision trees which is one of the classification methods in depth. Different algorithms can be used in decision trees according to type of variables. C5.0, CART and CHAID are the most popular algorithms. In this study, C5.0, CART and CHAID algorithms are examined in depth. Each observation in the mushroom data set obtained from The UCI Machine Learning Repository database has been tried to be classified as poisonous or edible by using decision trees algorithms which are data mining classification methods.
Benzer Tezler
- Veri madenciliği yöntemlerini kullanarak anemi sınıflandırılmasına yönelik bir uygulama
Classification of anemia using data mining methods: An application
BETÜL MERVE FAKI
Yüksek Lisans
Türkçe
2015
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. BAŞAR ÖZTAYŞİ
- Sürücü kaynaklı trafik kazalarının veri madenciliği yaklaşımı ile modellenmesi: Sakarya örneği
Modelling driver-related traffic accidents through data mining approach: The case of city of Sakarya
ZELİHA ÇAĞLA KUYUMCU
Doktora
Türkçe
2024
TrafikSakarya Üniversitesiİnşaat Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ HAKAN ASLAN
PROF. DR. NİLÜFER YURTAY
- Karayollarında meydana gelen trafik kazalarının karar ağaçları ve birliktelik analizi ile incelenmesi
Evaluation of road traffic accidents using decision trees and association analysis
ESRA SÖZEN - ATILGAN
Yüksek Lisans
Türkçe
2011
KazalarHacettepe Üniversitesiİstatistik Ana Bilim Dalı
YRD. DOÇ. DR. İBRAHİM ZOR
- K-en yakın komşuluk, yapay sinir ağları ve karar ağaçları yöntemlerinin sınıflandırma başarılarının karşılaştırılması
Comparing classification success of k-nearest neighbor, artifical neural network and decision trees
FÜRÜZAN KÖKTÜRK
Doktora
Türkçe
2012
BiyoistatistikBülent Ecevit ÜniversitesiBiyoistatistik Ana Bilim Dalı
PROF. DR. VİLDAN SÜMBÜLOĞLU
- Metin madenciliğinde kullanılan yöntemlerin karşılaştırılması: Siyasi parti liderlerinin grup genel toplantı konuşmaları ile bir uygulama
Comparison of techniques and methodologies used in text mining: An application with group meeting speeches of Turkish political part leaders
KEZİBAN SEÇKİN
Yüksek Lisans
Türkçe
2011
Siyasal BilimlerSakarya Üniversitesiİşletme Ana Bilim Dalı
DOÇ. DR. ERMAN COŞKUN