Geri Dön

Merkez tabanlı kümeleme algoritmalarının karşılaştırılması

The comparison a center-based clustering algorithms

  1. Tez No: 233167
  2. Yazar: AYSEL BİLGİN
  3. Danışmanlar: YRD. DOÇ. DR. NEVCİHAN DURU
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Mühendislik Bilimleri, Computer Engineering and Computer Science and Control, Engineering Sciences
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2008
  8. Dil: Türkçe
  9. Üniversite: Kocaeli Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 204

Özet

Kümeleme, Öklit veya Manhattan uzaklığı gibi bir benzerlik ölçümüne dayalı olarak veriyi doğal gruplara ayırma işlemidir. Kümelemede amaç, grup içindeki nesnelerin benzer olması ve bu nesnelerin diğer gruplar içindeki nesnelerden farklı ve başka olmasıdır. Kümelemenin biyoloji, iklim, eğitim, arkeoloji, örüntü tanımlama, tıp, psikoloji ve ilaçlar, elektronik bankacılık, görüntü işleme, astronomi, istatistik ve mühendislik gibi alanlar ile yakından ilişki olması onun daha da gelişmesini sağlamıştır. Kümelenecek olan verinin yapısına bağlı olarak farklı özelliklere sahip birçok kümeleme metodu ortaya çıkmıştır. Kümeleme metotlarından en popüler olanlardan biri bölümlemeli kümeleme metotlarının bir sınıfı olan merkez tabanlı kümeleme algoritmalardır. Merkez tabanlı kümeleme algoritmaları içinde en temel olan K-ortalama kümeleme algoritmasıdır. Diğer merkez tabanlı kümeleme algoritmaları, beklenen eniyileme algoritması ve K-ortalama algoritmasından türetilmiş olan, Bulanık K-Ortalama ve K-Harmonik Ortalama algoritmalarıdır. Merkez tabanlı kümeleme algoritmalarının her birinin kendine ait bir amaç fonksiyonu bulunmaktadır. Bu algoritmaların amacı, kendi amaç fonksiyonlarını en aza indirmektir. Bu çalışma da K-Ortalama, Bulanık K-Ortalama, K-Harmonik Ortalama algoritmaları ve K-Ortalama ve K-Harmonik Ortalama algoritmalarının özelliklerini içeren Hibrit 1 ve Hibrit 2 algoritmaları farklı veri kümeleri üzerinde uygulanmış ve performans değeri ve işlemci zamanına göre karşılaştırılmıştır. Çalışmada kullanılan veriler UCI veri deposundan alınmıştır. Bu çalışma ile merkez tabanlı kümeleme algoritmalarından biri ile kümeleme işlemi yapılacağı zaman ilgili veri kümesi için hangi algoritmanın daha uygun olduğuna karar vermede uzman kişiye yardımcı olmak hedeflenmiştir.

Özet (Çeviri)

Data clustering is the process of identifying clusters based on some similarity measure like Euclidean, Manhattan distance. The goal of clustering is that patterns within a cluster are similar and different from the patterns in other clusters. The close relationship between data clustering and biology, climate, education, archeology, pattern recognition, medical, psychology and medicine, banking, signal processing, astronomy, statistic, engineering, has caused to improve it. Many clustering methods have appeared based on the structure of data that will be clustered. One popular class of data clustering algorithms is the center-based clustering algorithms. The main algorithm in the center-based clustering algorithms is K-means clustering algorithm. The other center based clustering algorithms, which was developed from k-means and Expectation-maximization, are fuzzy k-means and k-harmonic means algorithm. They each have their own objective function and they try to mininize its own objective function. In this study k-means, fuzzy k-means, k-harmonic means algorithms and two algorithms are named Hybrid 1 and Hybrid 2 that combine features of k-means and k-harmonic means algorithms have been run on different kind of data sets and compared according to their performance value and CPU time. Data that used in this study have been taken from UCI warehouse. The purpose of this study is to help experts making decision about suitable algorithm for relevant data set when they will make a clustering with one of these center-based clustering algorithms.

Benzer Tezler

  1. Context aware real-time clustering with cortical coding method

    Kortikal kodlama yöntemi ile bağlama duyarlı gerçek zamanlı kümeleme

    SELİM EREN ERYILMAZ

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. BURAK BERK ÜSTÜNDAĞ

  2. Metin madenciliğinde kümeleme algoritmalarının matematiksel analizi üzerine

    On mathematical analysis of clustering algorithms in text mining

    OĞUZCAN ULUDAĞ

    Yüksek Lisans

    Türkçe

    Türkçe

    2017

    MatematikEge Üniversitesi

    Matematik Ana Bilim Dalı

    DOÇ. DR. BURAK ORDİN

  3. Yağış serilerinde kümeleme ve anormallik tespiti için yoğunluk tabanlı veri madenciliği algoritmalarının geliştirilmesi

    Development of density based data mining algorithms for clustering and anomaly detection in precipitation time series

    AHMET ÖZEKES

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    Çevre MühendisliğiErciyes Üniversitesi

    Çevre Mühendisliği Ana Bilim Dalı

    DOÇ. DR. FİLİZ DADAŞER ÇELİK

  4. İç ortamlarda anlamsal tabanlı keşif algoritmalarının geliştirilmesi

    Developing semantic-based exploration algorithms in indoor environments

    BURAK KALECİ

    Doktora

    Türkçe

    Türkçe

    2016

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEskişehir Osmangazi Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. OSMAN PARLAKTUNA

  5. Telsiz duyarga ağlarında dağıtık uygulamalar için küme ve omurga tabanlı iletişim mimarileri

    Cluster and backbone based communication architectures for distributed applications in wireless sensor networks

    ORHAN DAĞDEVİREN

    Doktora

    Türkçe

    Türkçe

    2010

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEge Üniversitesi

    Uluslararası Bilgisayar Ana Bilim Dalı

    PROF. DR. KAYHAN ERCİYEŞ