Geri Dön

Çokboyutlu veritabanlarında kümeleme yöntemleri.

Çokboyutlu veritabanlarında kümeleme yöntemleri.

  1. Tez No: 327261
  2. Yazar: ELVİN NASIBOV
  3. Danışmanlar: DOÇ. DR. BURAK ORDİN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Bilim ve Teknoloji, Matematik, Computer Engineering and Computer Science and Control, Science and Technology, Mathematics
  6. Anahtar Kelimeler: Bulanık c-Ortalamalar, Global k-Ortalamalar, Bulanık Kümeleme, Pürüzlü Optimizasyon, Fuzzy c-Means, Global k-Means, Fuzzy Clustering, Nonsmooth Optimization
  7. Yıl: 2012
  8. Dil: Türkçe
  9. Üniversite: Ege Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Bilimleri Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 78

Özet

Veri madenciliği yöntemlerinden biri olan Kümeleme Analizi, verilerin özelliklerini gözönüne alarak, birbirleri ile benzer olan verileri alt kümelere ayırmayı sağlayan çok boyutlu veri analiz yöntemidir. Kümeleme analizinin bir diğer tanımı da şu şekilde verilebilir: Özellikler arası benzerlik ya da farklılıklara dayalı olarak hesaplanan bazı ölçülerden yararlanarak verileri homojen gruplara bölmek, belirli prototipler tanımlamaktır.Kümeleme yöntemleri hiyerarşik ve hiyerarşik olmayan yöntemler olarak iki sınıfa ayrılır. Hiyerarşik kümelemede veri noktaları belirli bölümleme düzeylerinde birleştirilir veya ayrıştırılır. Hiyerarşik olmayan kümeleme yaklaşımında ise, veri noktaları belirli bölümleme kriterlerine göre belirli sayıda kümelere ayrılır.Bu tezde, hiyerarşik olmayan kümeleme yaklaşımına dayanan, veri setindeki veri grupları arasında kesin ayrımın söz konusu olduğu, kesin kümeleme algoritmalarından olan artımlı algoritmalar incelenmiştir. Kesin kümeleme içerisinde yer alan artımlı algoritmalar, veri setindeki veri grupları arasında kesin ayrımın söz konusu olmadığı, bir verinin belirli bir üyelik derecesiyle birden fazla kümeye ait olabildiği bulanık kümeleme yöntemleri ile beraber ele alınıp, bulanık kümeleme problemleri için yeni bir algoritma önerilmiştir. Önerilen artımlı yöntem C# dilinde MS SQL Server Veri Tabanı Yönetim Sistemi imkanları kullanılarak programlanıp, 12 gerçek veri seti üzerinde hesaplama denemeleri yapılmıştır. Önerilen algoritma Bulanık c-Ortalamalar algoritması ile kıyaslandığında yöntemin yararlılığı açıkça görülmektedir.

Özet (Çeviri)

The Clustering Analysis, is one of the main techniques of data mining and it is also the method of analysis of multidimensional databases which divides the data set into clusters based on the similarity of data points. Another definition of cluster analysis can be given as follows: Divide data into homogeneous groups by using calculated measures on the basis of similarities or differences among the properties, to identify the specific prototypes.Clustering methods are divided into two classes: Hierarchical and non-hierarchical methods. On Hierarchical clustering the data points are combined and separated with the specific levels of partitioning. On non-hierarchical approaching the data points are divided into given number of clusters, according to the given criteria.In this thesis, the exact (hard) incremental clustering algorithms were investigated. This algoritms are based on the approach of non-hierarchical clustering. The hard incremental clustering algorithms with fuzzy clustering algorithms where there is not absolute division between the groups, and each data data may belong to more than one cluster with the fuzzy membership degree, are examined and a new algorithm is proposed for fuzzy clustering problems. The proposed incremental method programmed in C # using MS SQL Server and calculation experiments have been made on 12 real data set. The proposed method compared with the Fuzzy c-Means algorithm and usefulness of method is clearly seen.

Benzer Tezler

  1. Çok boyutlu veritabanlarında veri madenciliği yöntemleri kullanılarak bilgi keşfi

    In multidimensional databases, discovery of information by using of data mining methods

    HUSEYN HASANLI

    Yüksek Lisans

    Türkçe

    Türkçe

    2014

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEge Üniversitesi

    Matematik Ana Bilim Dalı

    DOÇ. DR. BURAK ORDİN

  2. Metin madenciliği için iyileştirilmiş bir kümeleme yapısının tasarımı ve uygulaması

    Design and application of an improved clustering algorithm for text mining

    VOLKAN TUNALI

    Doktora

    Türkçe

    Türkçe

    2011

    Bilgi ve Belge YönetimiMarmara Üniversitesi

    Elektronik-Bilgisayar Eğitimi Ana Bilim Dalı

    PROF. DR. A. YILMAZ ÇAMURCU

    YRD. DOÇ. DR. T. TUGAY BİLGİN

  3. A knowledge discovery approach to urban analysis the Beyoğlu preservation area as a data mine

    Kent analizinde bir bilgi keşfi yaklaşımı bir veri madeni olarak Beyoğlu kentsel koruma alanı

    AHU SÖKMENOĞLU SOHTORİK

    Doktora

    İngilizce

    İngilizce

    2016

    Mimarlıkİstanbul Teknik Üniversitesi

    Mimarlık Ana Bilim Dalı

    PROF. DR. GÜLEN ÇAĞDAŞ

    PROF. DR. İKBAL SEVİL SARIYILDIZ

  4. A K-means clustering-based shape retrieval technique for 3D mesh models

    Üç boyutlu çözüm ağları için K-means kümeleme tabanlı şekil araması

    MOHAMMADHASSAN REZAEI

    Yüksek Lisans

    İngilizce

    İngilizce

    2017

    Makine Mühendisliğiİstanbul Teknik Üniversitesi

    Makine Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. ERKAN GÜNPINAR

  5. Yüksek boyutlu model gösterilimi ile görüntü kümeleme ve görüntü erişimi

    Image clustering and image retrieval with high dimensional model representation

    AYŞEGÜL KARCILI

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    Matematikİstanbul Teknik Üniversitesi

    Matematik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. BURCU TUNGA