Geri Dön

Sürekli veri setlerinin farklı ayrıklaştırma yöntemleri kullanılarak kural tabanlı sınıflandırma algoritmalarına uyarlanması ve karşılaştırılması

Adaptation and comparison of continuous data sets to rule-based classification algorithms by using different discretization methods

  1. Tez No: 540016
  2. Yazar: SANARYA SAMAL FAROOQ FAROOQ
  3. Danışmanlar: DR. ÖĞR. ÜYESİ MURAT SELEK
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2019
  8. Dil: Türkçe
  9. Üniversite: Selçuk Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 56

Özet

Veri ayrıklaştırma, veri madenciliğinde kullanılan en popüler veri ön işleme tekniklerinden biridir. Veri ayrıklaştırma işleminde sürekli olan değerler belirli aralıklara göre ayrık değerlere dönüşür. Literatürde birden fazla ayrıklaştırma yöntemi bulunabilir, fakat bu ayrıklaştırma yöntemlerinin içinde en yaygın olanlar Eşit Genişlik (EG), Eşit Frekans (EF) ve Entropi yöntemleridir. Her ayrıklaştırma yönteminin kendine göre avantaj ve dezavantajları bulunmaktadır. Veri ayrıklaştırma işlemi veri kümeleri üzerinde birçok işlemi kolaylaştırır ve hızlandırır. Literatürde araştırmacılar tarafından geliştirilen birçok ayrıklaştırma teknikleri bulunmaktadır. Geliştirilen bu ayrıklaştırma yöntemleri veri madenciliğinde sınıflandırma başarısını artırması, verilerin hızlı ve basit bir şekilde işlenmesi gibi birçok amaç için kullanılmaktadır. Veri madenciliğinde kural tabanlı sınıflandırma algoritmaları ayrık değerli özeliklere sahip olan veri kümelerinde daha iyi performans ve sınıflandırma başarıları göstermektedir. Bu çalışmanın amacı sürekli değerli veri özeliklerine sahip olan veri kümelerinin özellik değerlerini EG, EF ve Entropi Tabanlı ayrıklaştırma yöntemleri ile ayrıklaştırarak, Karar Ağacı ID3, Naive Bayes (NB) ve Karar Tablo (KT) Kural Tabanlı sınıflandırma algoritmalarına uyarlanması ile daha iyi bir sınıflandırma başarısı elde etmektir. Bu çalışmada, UCI veri seti içinden sıkça kullanılan 13 adet sürekli değerli özelliklere sahip olan veri seti alınmaktadır. Bu veri setlerinin özellik değerleri ayrık değerlere dönüştürülerek farklı sınıflandırma algoritmaları üzerine uyarlanmaktadır. Bu sayede sınıflandırma algoritmasına verilen ayrıklaştırılmış verilerin sınıflandırma başarısının artması sağlanacaktır.

Özet (Çeviri)

Data discretization is one of the most popular data preprocessing techniques used in data mining. Values that are continuous in the data discretization process become discrete values over certain intervals. In literature, more than one discretization method can be found but the most common methods are equal width, equal frequency, and entropy. Each discretization method has its own advantages and disadvantages. Data discretization process makes easier and faster many operations on data sets. In literature there are many discretization techniques that developed by researchers. These discretization methods are used for many purposes such as increasing the classification success in the data mining, processing the data quickly and simply. Rule-based classification algorithms in data mining show better performance and classification success in data sets with discrete properties. The aim of this thesis is to obtain a better classification performance by adapting the property values of data sets with continuous valuable data properties by equal width, equal frequency and entropy based discretization methods and adaptation to decision tree ID3, Naive Bayes and decision table rule based classification algorithms. The importance of this thesis is to increase the classification performance on rule-based classification algorithms of continuous data sets. In this thesis, a data set which has 10 continuously valuable properties which are frequently used from UCI data sets will be taken. The property values of these data sets are transformed into discrete values and are adapted to rule-based classification algorithms. Thus the classification success of the discrete data which given to the classification algorithm will be increased.

Benzer Tezler

  1. Active learning based human in the loop deep object detectionfor scalable data annotation

    Ölçeklenebilir veri etiketlenmesi için aktif öğrenme tabanlı insan katılımlı derin nesne tespiti sistemi

    ATABERK ARMAN KAYHAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Uçak ve Uzay Mühendisliği Ana Bilim Dalı

    DOÇ. DR. NAZIM KEMAL ÜRE

  2. Comparison of dynamic rule mining algorithms

    Devingen kural madenciliği algoritmalarının karşılaştırılması

    KARUNDA SHARIFF

    Yüksek Lisans

    İngilizce

    İngilizce

    2012

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİzmir Yüksek Teknoloji Enstitüsü

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. BELGİN ERGENÇ

  3. Particulate matter 2.5 – PM2.5 mapping using MODIS satellite data and multivariate non-linear regression analysis over Marmara Region – Turkey

    MODIS uydu verileri ve çok değişkenli doğrusal olmayan regresyon analizi ile partiküler madde 2.5-PM2.5 haritasının Marmara Bölgesi-Türkiye için üretilmesi

    MIDYAN ALDABASH

    Doktora

    İngilizce

    İngilizce

    2021

    Jeodezi ve Fotogrametriİstanbul Teknik Üniversitesi

    Geomatik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. FİLİZ BEKTAŞ BALÇIK

  4. Analysis and applications of data mining algorithms

    Veri madenciliği algoritmalarının analizi ve uygulanması

    NESLİHAN DOĞAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2010

    İşletmeBoğaziçi Üniversitesi

    Yönetim Bilişim Sistemleri Ana Bilim Dalı

    DOÇ. DR. ZUHAL TANRIKULU

  5. A comprehensive dataset including force cues for gesture recognition and skills assessment in robotic surgery

    Robotik cerrahiide kuvvet ipuçları içeren kapsamlı bir veri seti hareket tanıma ve beceri değerlendirmesi

    DENİZ EKİN CANBAY

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Mekatronik Mühendisliğiİstanbul Teknik Üniversitesi

    Mekatronik Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ NAZIM KEMAL ÜRE

    DR. ÖĞR. ÜYESİ FANNY FICUCIELLO