Veri madenciliğinde hiyerarşik kümeleme algoritmalarının uygulamalı karşılaştırılması
Comparison of hierarchical clustering algorithms in data mining with applications
- Tez No: 577626
- Danışmanlar: PROF. DR. AHMET METE ÇİLİNGİRTÜRK
- Tez Türü: Yüksek Lisans
- Konular: Ekonometri, İstatistik, Econometrics, Statistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2019
- Dil: Türkçe
- Üniversite: Marmara Üniversitesi
- Enstitü: Sosyal Bilimler Enstitüsü
- Ana Bilim Dalı: Ekonometri Ana Bilim Dalı
- Bilim Dalı: İstatistik Bilim Dalı
- Sayfa Sayısı: 208
Özet
Büyük hacimli verilerin analiz edilerek faydalı bilgilerin keşfedilmesi ihtiyacından doğan veri madenciliği, istatistik başta olmak üzere çeşitli disiplinlerin katkısıyla gelişmekte olan bir alandır. Geniş veri tabanları, nesnelerin sahip olduğu nitelik sayısı ve bu niteliklerin farklı veri tiplerine sahip olması gibi sorunlar, nesnelerin istatistik bilimindeki klasik kümeleme yöntemleriyle ele alınmasını zorlaştırmaktadır. Veri madenciliği literatüründe, klasik kümeleme yöntemlerinin baş etmekte zorlandığı hacimdeki verilerin kümelenmesi için bazı kümeleme algoritmaları geliştirilmiştir. Bu çalışmada, veri madenciliği literatüründeki hiyerarşik kümeleme algoritmalarından CLUCDUH ve ROCK algoritmaları seçilerek örnek bir veri seti üzerinde karşılaştırılmıştır. Uygulama R üzerinde yapılmış, CLUCDUH algoritmasının R kodları geliştirilmiştir. Kullanılan Siluet, Dunn, Davies – Bouldin ve Gamma uyum indekslerine göre ROCK algoritmasının daha iyi kümeler oluşturduğu görülmüştür. Calinski – Harabasz indeksine göre CLUCDUH algoritmasının daha iyi kümeler oluşturduğu görülmüştür. Sınıf etiketlerine göre değerlendirildiğinde, iki algoritmanın da benzer kümeler oluşturduğu görülmüştür. Bununla birlikte, CLUCDUH algoritmasının, daha dengeli büyüklükte kümeler oluşturduğu gözlenmiştir.
Özet (Çeviri)
Data mining, which arises from the need to analyze large volumes of data and discover useful information, is a developing field with the contribution of various disciplines, especially statistics. Problems such as large databases, the number of attributes and different data types of objects make it difficult to handle objects with classical clustering methods in statistics. In the data mining literature, some clustering algorithms have been developed for clustering the volume of data that classical clustering methods have difficulty in overcoming. In this study, CLUCDUH and ROCK algorithms have been selected among hierarchical clustering algorithms in the data mining literature and compared on a sample data set. Comparing application has been conducted on R and the R code of the CLUCDUH algorithm has been developed. According to the Silhouette, Dunn, Davies – Bouldin and Gamma concordance indices, it was found that ROCK algorithm creates better clusters. According to Calinski – Harabasz index, it was found that CLUCDUH algorithm creates better clusters. When it is evaluated according to class labels, it has been observed that both algorithms formed similar clusters. Furthermore, it has been observed that the CLUCDUH algorithm creates more balanced sized clusters.
Benzer Tezler
- Hiyerarşik kümeleme metotları ile veri madenciliği uygulamaları
Data mining applications using hierarchical clustering algorithms
MERAL DEMİRALAY
Yüksek Lisans
Türkçe
2005
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMarmara ÜniversitesiDOÇ. DR. YILMAZ ÇAMURCU
- An application for the evaluation of clustering analysis in data mining
Veri madenciliğinde kümeleme analizinin değerlendirilmesi için bir uygulama
TANZER AKTAŞ
Yüksek Lisans
İngilizce
2020
Endüstri ve Endüstri Mühendisliğiİzmir Ekonomi ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
PROF. DR. AHMET SERMET ANAGÜN
- Veri madenciliğinde kümeleme analizi ve hibrit verilerin kümelenmesi üzerine bir algoritma
Clustering analysis in data mining and an algorithm on clustering hybrid data
OSMAN ÇÖREKCİ
Yüksek Lisans
Türkçe
2017
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik ÜniversitesiMatematik Mühendisliği Ana Bilim Dalı
DOÇ. DR. AYLA ŞAYLI
- Hiyerarşik kümeleme tekniklerinde küme eleman sayısının eşitlenmesine yönelik bir yaklaşım önerisi ve gerçek karayolu uzaklık verilerine dayalı kümeleme analizi
An approach proposal for equalization of the number of cluster elements at hierarchical clustering techniques and a cluster analysis based on real highway distance data
AKİF TAŞATAN
Yüksek Lisans
Türkçe
2018
Endüstri ve Endüstri MühendisliğiKocaeli ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. KASIM BAYNAL
- Kohonen öz örgütlemeli haritalama yöntemi ile psikotik hastalıkların kümelenmesi
Kohonen cluster of psychotic diseases by self organizing mapping method
ASLI ÇİFTCİ
Yüksek Lisans
Türkçe
2018
BiyoistatistikHacettepe ÜniversitesiBiyoistatistik Bilim Dalı
DR. ÖĞR. ÜYESİ SEVİLAY KARAHAN