Geri Dön

Veri madenciliği sınıflandırma yöntemlerinden karar ağaçları ve bir uygulama

Data mining classification method decision trees and an application

  1. Tez No: 582493
  2. Yazar: NURİYE TOPYILDIZ
  3. Danışmanlar: DR. ÖĞR. ÜYESİ YUNUS AKDOĞAN
  4. Tez Türü: Yüksek Lisans
  5. Konular: İstatistik, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2019
  8. Dil: Türkçe
  9. Üniversite: Selçuk Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 55

Özet

Bilişim teknolojisi çok büyük miktarlardaki veriyi saklamayı mümkün kılmaktadır. Biriken veri üzerinde analizler yapmak amacıyla çeşitli matematiksel ve istatistiksel yöntemler kullanılabilmektedir. Fakat veri miktarı arttıkça sorunlar ortaya çıkmaktadır. Bu veriyi yönetmek ve veriyi çözümleyerek“yararlı bilgiye”erişilmesini sağlayabilmek için veri madenciliği yöntemi geliştirilmiştir. Veri madenciliği, en basit tanımıyla, toplanan veriyi bilgiye dönüştürme tekniklerinin bütünüdür. Madencilik teriminin kullanılmasının nedeni ise, büyük miktarda verinin içerisinden bilgiye dönüşecek uygun veriyi arama işleminin maden arama işiyle benzerlik göstermesidir. Bu çalışmanın önemi; günümüzde oldukça önemli ve de ihtiyaç duyulan bir alan haline gelen veri madenciliğinin sınıflandırma yöntemlerinden olan karar ağaçlarını derinlemesine ele alıyor olmasıdır. Karar ağaçlarında, değişken tiplerine göre farklı algoritmalar kullanılabilmektedir. C5.0, CART ve CHAID en popüler algoritmalardır. Bu çalışmada da, C5.0, CART ve CHAID algoritmaları derinlemesine incelenmiştir. The UCI Machine Learning Repository veritabanından temin edilen mantar veri setinde yer alan her bir gözlem, veri madenciliği sınıflandırma yöntemlerinden karar ağaçları algoritmaları kullanılarak zehirli veya yenilebilir şeklinde sınıflandırılmaya çalışılmıştır.

Özet (Çeviri)

Information technology makes it possible to store huge amounts of data. Various mathematical and statistical methods can be used to analyze the accumulated data. However, as the amount of data increases, problems arise. Data mining method has been developed to manage this data and provide accessibility to“useful information”via analyzing the data. Data mining, in its simplest definition, is a collection of techniques for converting collected data into information. The reason for using the term mining is that the process of searching for the appropriate data to be transformed into information from a large amount of data is similar to that of mining. The importance of this study; the fact that data mining, which has become a very important and needed field in today's world, covers the decision trees which is one of the classification methods in depth. Different algorithms can be used in decision trees according to type of variables. C5.0, CART and CHAID are the most popular algorithms. In this study, C5.0, CART and CHAID algorithms are examined in depth. Each observation in the mushroom data set obtained from The UCI Machine Learning Repository database has been tried to be classified as poisonous or edible by using decision trees algorithms which are data mining classification methods.

Benzer Tezler

  1. Veri madenciliği yöntemlerini kullanarak anemi sınıflandırılmasına yönelik bir uygulama

    Classification of anemia using data mining methods: An application

    BETÜL MERVE FAKI

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. BAŞAR ÖZTAYŞİ

  2. Sürücü kaynaklı trafik kazalarının veri madenciliği yaklaşımı ile modellenmesi: Sakarya örneği

    Modelling driver-related traffic accidents through data mining approach: The case of city of Sakarya

    ZELİHA ÇAĞLA KUYUMCU

    Doktora

    Türkçe

    Türkçe

    2024

    TrafikSakarya Üniversitesi

    İnşaat Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ HAKAN ASLAN

    PROF. DR. NİLÜFER YURTAY

  3. Karayollarında meydana gelen trafik kazalarının karar ağaçları ve birliktelik analizi ile incelenmesi

    Evaluation of road traffic accidents using decision trees and association analysis

    ESRA SÖZEN - ATILGAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2011

    KazalarHacettepe Üniversitesi

    İstatistik Ana Bilim Dalı

    YRD. DOÇ. DR. İBRAHİM ZOR

  4. K-en yakın komşuluk, yapay sinir ağları ve karar ağaçları yöntemlerinin sınıflandırma başarılarının karşılaştırılması

    Comparing classification success of k-nearest neighbor, artifical neural network and decision trees

    FÜRÜZAN KÖKTÜRK

    Doktora

    Türkçe

    Türkçe

    2012

    BiyoistatistikBülent Ecevit Üniversitesi

    Biyoistatistik Ana Bilim Dalı

    PROF. DR. VİLDAN SÜMBÜLOĞLU

  5. Metin madenciliğinde kullanılan yöntemlerin karşılaştırılması: Siyasi parti liderlerinin grup genel toplantı konuşmaları ile bir uygulama

    Comparison of techniques and methodologies used in text mining: An application with group meeting speeches of Turkish political part leaders

    KEZİBAN SEÇKİN

    Yüksek Lisans

    Türkçe

    Türkçe

    2011

    Siyasal BilimlerSakarya Üniversitesi

    İşletme Ana Bilim Dalı

    DOÇ. DR. ERMAN COŞKUN