Geri Dön

Veri madenciliğinde hiyerarşik kümeleme algoritmalarının uygulamalı karşılaştırılması

Comparison of hierarchical clustering algorithms in data mining with applications

  1. Tez No: 577626
  2. Yazar: YUSUF ALTINOK
  3. Danışmanlar: PROF. DR. AHMET METE ÇİLİNGİRTÜRK
  4. Tez Türü: Yüksek Lisans
  5. Konular: Ekonometri, İstatistik, Econometrics, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2019
  8. Dil: Türkçe
  9. Üniversite: Marmara Üniversitesi
  10. Enstitü: Sosyal Bilimler Enstitüsü
  11. Ana Bilim Dalı: Ekonometri Ana Bilim Dalı
  12. Bilim Dalı: İstatistik Bilim Dalı
  13. Sayfa Sayısı: 208

Özet

Büyük hacimli verilerin analiz edilerek faydalı bilgilerin keşfedilmesi ihtiyacından doğan veri madenciliği, istatistik başta olmak üzere çeşitli disiplinlerin katkısıyla gelişmekte olan bir alandır. Geniş veri tabanları, nesnelerin sahip olduğu nitelik sayısı ve bu niteliklerin farklı veri tiplerine sahip olması gibi sorunlar, nesnelerin istatistik bilimindeki klasik kümeleme yöntemleriyle ele alınmasını zorlaştırmaktadır. Veri madenciliği literatüründe, klasik kümeleme yöntemlerinin baş etmekte zorlandığı hacimdeki verilerin kümelenmesi için bazı kümeleme algoritmaları geliştirilmiştir. Bu çalışmada, veri madenciliği literatüründeki hiyerarşik kümeleme algoritmalarından CLUCDUH ve ROCK algoritmaları seçilerek örnek bir veri seti üzerinde karşılaştırılmıştır. Uygulama R üzerinde yapılmış, CLUCDUH algoritmasının R kodları geliştirilmiştir. Kullanılan Siluet, Dunn, Davies – Bouldin ve Gamma uyum indekslerine göre ROCK algoritmasının daha iyi kümeler oluşturduğu görülmüştür. Calinski – Harabasz indeksine göre CLUCDUH algoritmasının daha iyi kümeler oluşturduğu görülmüştür. Sınıf etiketlerine göre değerlendirildiğinde, iki algoritmanın da benzer kümeler oluşturduğu görülmüştür. Bununla birlikte, CLUCDUH algoritmasının, daha dengeli büyüklükte kümeler oluşturduğu gözlenmiştir.

Özet (Çeviri)

Data mining, which arises from the need to analyze large volumes of data and discover useful information, is a developing field with the contribution of various disciplines, especially statistics. Problems such as large databases, the number of attributes and different data types of objects make it difficult to handle objects with classical clustering methods in statistics. In the data mining literature, some clustering algorithms have been developed for clustering the volume of data that classical clustering methods have difficulty in overcoming. In this study, CLUCDUH and ROCK algorithms have been selected among hierarchical clustering algorithms in the data mining literature and compared on a sample data set. Comparing application has been conducted on R and the R code of the CLUCDUH algorithm has been developed. According to the Silhouette, Dunn, Davies – Bouldin and Gamma concordance indices, it was found that ROCK algorithm creates better clusters. According to Calinski – Harabasz index, it was found that CLUCDUH algorithm creates better clusters. When it is evaluated according to class labels, it has been observed that both algorithms formed similar clusters. Furthermore, it has been observed that the CLUCDUH algorithm creates more balanced sized clusters.

Benzer Tezler

  1. Hiyerarşik kümeleme metotları ile veri madenciliği uygulamaları

    Data mining applications using hierarchical clustering algorithms

    MERAL DEMİRALAY

  2. An application for the evaluation of clustering analysis in data mining

    Veri madenciliğinde kümeleme analizinin değerlendirilmesi için bir uygulama

    TANZER AKTAŞ

    Yüksek Lisans

    İngilizce

    İngilizce

    2020

    Endüstri ve Endüstri Mühendisliğiİzmir Ekonomi Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    PROF. DR. AHMET SERMET ANAGÜN

  3. Veri madenciliğinde kümeleme analizi ve hibrit verilerin kümelenmesi üzerine bir algoritma

    Clustering analysis in data mining and an algorithm on clustering hybrid data

    OSMAN ÇÖREKCİ

    Yüksek Lisans

    Türkçe

    Türkçe

    2017

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik Üniversitesi

    Matematik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. AYLA ŞAYLI

  4. Hiyerarşik kümeleme tekniklerinde küme eleman sayısının eşitlenmesine yönelik bir yaklaşım önerisi ve gerçek karayolu uzaklık verilerine dayalı kümeleme analizi

    An approach proposal for equalization of the number of cluster elements at hierarchical clustering techniques and a cluster analysis based on real highway distance data

    AKİF TAŞATAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    Endüstri ve Endüstri MühendisliğiKocaeli Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DOÇ. DR. KASIM BAYNAL

  5. Kohonen öz örgütlemeli haritalama yöntemi ile psikotik hastalıkların kümelenmesi

    Kohonen cluster of psychotic diseases by self organizing mapping method

    ASLI ÇİFTCİ

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    BiyoistatistikHacettepe Üniversitesi

    Biyoistatistik Bilim Dalı

    DR. ÖĞR. ÜYESİ SEVİLAY KARAHAN