Çokboyutlu veritabanlarında kümeleme yöntemleri.
Çokboyutlu veritabanlarında kümeleme yöntemleri.
- Tez No: 327261
- Danışmanlar: DOÇ. DR. BURAK ORDİN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Bilim ve Teknoloji, Matematik, Computer Engineering and Computer Science and Control, Science and Technology, Mathematics
- Anahtar Kelimeler: Bulanık c-Ortalamalar, Global k-Ortalamalar, Bulanık Kümeleme, Pürüzlü Optimizasyon, Fuzzy c-Means, Global k-Means, Fuzzy Clustering, Nonsmooth Optimization
- Yıl: 2012
- Dil: Türkçe
- Üniversite: Ege Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Bilimleri Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 78
Özet
Veri madenciliği yöntemlerinden biri olan Kümeleme Analizi, verilerin özelliklerini gözönüne alarak, birbirleri ile benzer olan verileri alt kümelere ayırmayı sağlayan çok boyutlu veri analiz yöntemidir. Kümeleme analizinin bir diğer tanımı da şu şekilde verilebilir: Özellikler arası benzerlik ya da farklılıklara dayalı olarak hesaplanan bazı ölçülerden yararlanarak verileri homojen gruplara bölmek, belirli prototipler tanımlamaktır.Kümeleme yöntemleri hiyerarşik ve hiyerarşik olmayan yöntemler olarak iki sınıfa ayrılır. Hiyerarşik kümelemede veri noktaları belirli bölümleme düzeylerinde birleştirilir veya ayrıştırılır. Hiyerarşik olmayan kümeleme yaklaşımında ise, veri noktaları belirli bölümleme kriterlerine göre belirli sayıda kümelere ayrılır.Bu tezde, hiyerarşik olmayan kümeleme yaklaşımına dayanan, veri setindeki veri grupları arasında kesin ayrımın söz konusu olduğu, kesin kümeleme algoritmalarından olan artımlı algoritmalar incelenmiştir. Kesin kümeleme içerisinde yer alan artımlı algoritmalar, veri setindeki veri grupları arasında kesin ayrımın söz konusu olmadığı, bir verinin belirli bir üyelik derecesiyle birden fazla kümeye ait olabildiği bulanık kümeleme yöntemleri ile beraber ele alınıp, bulanık kümeleme problemleri için yeni bir algoritma önerilmiştir. Önerilen artımlı yöntem C# dilinde MS SQL Server Veri Tabanı Yönetim Sistemi imkanları kullanılarak programlanıp, 12 gerçek veri seti üzerinde hesaplama denemeleri yapılmıştır. Önerilen algoritma Bulanık c-Ortalamalar algoritması ile kıyaslandığında yöntemin yararlılığı açıkça görülmektedir.
Özet (Çeviri)
The Clustering Analysis, is one of the main techniques of data mining and it is also the method of analysis of multidimensional databases which divides the data set into clusters based on the similarity of data points. Another definition of cluster analysis can be given as follows: Divide data into homogeneous groups by using calculated measures on the basis of similarities or differences among the properties, to identify the specific prototypes.Clustering methods are divided into two classes: Hierarchical and non-hierarchical methods. On Hierarchical clustering the data points are combined and separated with the specific levels of partitioning. On non-hierarchical approaching the data points are divided into given number of clusters, according to the given criteria.In this thesis, the exact (hard) incremental clustering algorithms were investigated. This algoritms are based on the approach of non-hierarchical clustering. The hard incremental clustering algorithms with fuzzy clustering algorithms where there is not absolute division between the groups, and each data data may belong to more than one cluster with the fuzzy membership degree, are examined and a new algorithm is proposed for fuzzy clustering problems. The proposed incremental method programmed in C # using MS SQL Server and calculation experiments have been made on 12 real data set. The proposed method compared with the Fuzzy c-Means algorithm and usefulness of method is clearly seen.
Benzer Tezler
- Çok boyutlu veritabanlarında veri madenciliği yöntemleri kullanılarak bilgi keşfi
In multidimensional databases, discovery of information by using of data mining methods
HUSEYN HASANLI
Yüksek Lisans
Türkçe
2014
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEge ÜniversitesiMatematik Ana Bilim Dalı
DOÇ. DR. BURAK ORDİN
- Metin madenciliği için iyileştirilmiş bir kümeleme yapısının tasarımı ve uygulaması
Design and application of an improved clustering algorithm for text mining
VOLKAN TUNALI
Doktora
Türkçe
2011
Bilgi ve Belge YönetimiMarmara ÜniversitesiElektronik-Bilgisayar Eğitimi Ana Bilim Dalı
PROF. DR. A. YILMAZ ÇAMURCU
YRD. DOÇ. DR. T. TUGAY BİLGİN
- A knowledge discovery approach to urban analysis the Beyoğlu preservation area as a data mine
Kent analizinde bir bilgi keşfi yaklaşımı bir veri madeni olarak Beyoğlu kentsel koruma alanı
AHU SÖKMENOĞLU SOHTORİK
Doktora
İngilizce
2016
Mimarlıkİstanbul Teknik ÜniversitesiMimarlık Ana Bilim Dalı
PROF. DR. GÜLEN ÇAĞDAŞ
PROF. DR. İKBAL SEVİL SARIYILDIZ
- A K-means clustering-based shape retrieval technique for 3D mesh models
Üç boyutlu çözüm ağları için K-means kümeleme tabanlı şekil araması
MOHAMMADHASSAN REZAEI
Yüksek Lisans
İngilizce
2017
Makine Mühendisliğiİstanbul Teknik ÜniversitesiMakine Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. ERKAN GÜNPINAR
- Yüksek boyutlu model gösterilimi ile görüntü kümeleme ve görüntü erişimi
Image clustering and image retrieval with high dimensional model representation
AYŞEGÜL KARCILI
Yüksek Lisans
Türkçe
2018
Matematikİstanbul Teknik ÜniversitesiMatematik Mühendisliği Ana Bilim Dalı
DOÇ. DR. BURCU TUNGA