Merkez tabanlı kümeleme algoritmalarının karşılaştırılması

The comparison a center-based clustering algorithms

PDF İndir

Tez No: 233167
Yazar: AYSEL BİLGİN
Danışmanlar: YRD. DOÇ. DR. NEVCİHAN DURU
Tez Türü: Yüksek Lisans
Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Mühendislik Bilimleri, Computer Engineering and Computer Science and Control, Engineering Sciences
Anahtar Kelimeler: Belirtilmemiş.
Yıl: 2008
Dil: Türkçe
Üniversite: Kocaeli Üniversitesi
Enstitü: Fen Bilimleri Enstitüsü
Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
Bilim Dalı: Belirtilmemiş.
Sayfa Sayısı: 204

Özet

Kümeleme, Öklit veya Manhattan uzaklığı gibi bir benzerlik ölçümüne dayalı olarak veriyi doğal gruplara ayırma işlemidir. Kümelemede amaç, grup içindeki nesnelerin benzer olması ve bu nesnelerin diğer gruplar içindeki nesnelerden farklı ve başka olmasıdır. Kümelemenin biyoloji, iklim, eğitim, arkeoloji, örüntü tanımlama, tıp, psikoloji ve ilaçlar, elektronik bankacılık, görüntü işleme, astronomi, istatistik ve mühendislik gibi alanlar ile yakından ilişki olması onun daha da gelişmesini sağlamıştır. Kümelenecek olan verinin yapısına bağlı olarak farklı özelliklere sahip birçok kümeleme metodu ortaya çıkmıştır. Kümeleme metotlarından en popüler olanlardan biri bölümlemeli kümeleme metotlarının bir sınıfı olan merkez tabanlı kümeleme algoritmalardır. Merkez tabanlı kümeleme algoritmaları içinde en temel olan K-ortalama kümeleme algoritmasıdır. Diğer merkez tabanlı kümeleme algoritmaları, beklenen eniyileme algoritması ve K-ortalama algoritmasından türetilmiş olan, Bulanık K-Ortalama ve K-Harmonik Ortalama algoritmalarıdır. Merkez tabanlı kümeleme algoritmalarının her birinin kendine ait bir amaç fonksiyonu bulunmaktadır. Bu algoritmaların amacı, kendi amaç fonksiyonlarını en aza indirmektir. Bu çalışma da K-Ortalama, Bulanık K-Ortalama, K-Harmonik Ortalama algoritmaları ve K-Ortalama ve K-Harmonik Ortalama algoritmalarının özelliklerini içeren Hibrit 1 ve Hibrit 2 algoritmaları farklı veri kümeleri üzerinde uygulanmış ve performans değeri ve işlemci zamanına göre karşılaştırılmıştır. Çalışmada kullanılan veriler UCI veri deposundan alınmıştır. Bu çalışma ile merkez tabanlı kümeleme algoritmalarından biri ile kümeleme işlemi yapılacağı zaman ilgili veri kümesi için hangi algoritmanın daha uygun olduğuna karar vermede uzman kişiye yardımcı olmak hedeflenmiştir.

Özet (Çeviri)

Data clustering is the process of identifying clusters based on some similarity measure like Euclidean, Manhattan distance. The goal of clustering is that patterns within a cluster are similar and different from the patterns in other clusters. The close relationship between data clustering and biology, climate, education, archeology, pattern recognition, medical, psychology and medicine, banking, signal processing, astronomy, statistic, engineering, has caused to improve it. Many clustering methods have appeared based on the structure of data that will be clustered. One popular class of data clustering algorithms is the center-based clustering algorithms. The main algorithm in the center-based clustering algorithms is K-means clustering algorithm. The other center based clustering algorithms, which was developed from k-means and Expectation-maximization, are fuzzy k-means and k-harmonic means algorithm. They each have their own objective function and they try to mininize its own objective function. In this study k-means, fuzzy k-means, k-harmonic means algorithms and two algorithms are named Hybrid 1 and Hybrid 2 that combine features of k-means and k-harmonic means algorithms have been run on different kind of data sets and compared according to their performance value and CPU time. Data that used in this study have been taken from UCI warehouse. The purpose of this study is to help experts making decision about suitable algorithm for relevant data set when they will make a clustering with one of these center-based clustering algorithms.

Benzer Tezler

Tez No
894539
Context aware real-time clustering with cortical coding method
Kortikal kodlama yöntemi ile bağlama duyarlı gerçek zamanlı kümeleme
SELİM EREN ERYILMAZ
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol İstanbul Teknik Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. BURAK BERK ÜSTÜNDAĞ
Tez No
479618
Metin madenciliğinde kümeleme algoritmalarının matematiksel analizi üzerine
On mathematical analysis of clustering algorithms in text mining
OĞUZCAN ULUDAĞ
Yüksek Lisans
Türkçe
2017
Matematik Ege Üniversitesi
Matematik Ana Bilim Dalı
DOÇ. DR. BURAK ORDİN
Tez No
654478
Yağış serilerinde kümeleme ve anormallik tespiti için yoğunluk tabanlı veri madenciliği algoritmalarının geliştirilmesi
Development of density based data mining algorithms for clustering and anomaly detection in precipitation time series
AHMET ÖZEKES
Yüksek Lisans
Türkçe
2021
Çevre Mühendisliği Erciyes Üniversitesi
Çevre Mühendisliği Ana Bilim Dalı
DOÇ. DR. FİLİZ DADAŞER ÇELİK
Tez No
949054
Core network anomaly detection using the LSTM model and comparison with various unsupervised learning methods
Telekomünikasyon merkezi şebekelerinde LSTM model ile anomali tespiti ve bazı denetimsiz öğrenme metotları ile kıyaslanması
SAMED ÇALIK
Yüksek Lisans
İngilizce
2025
Endüstri ve Endüstri Mühendisliği İstanbul Teknik Üniversitesi
Büyük Veri ve İş Analitiği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ MEHMET ALİ ERGÜN
Tez No
436620
İç ortamlarda anlamsal tabanlı keşif algoritmalarının geliştirilmesi
Developing semantic-based exploration algorithms in indoor environments
BURAK KALECİ
Doktora
Türkçe
2016
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Eskişehir Osmangazi Üniversitesi
Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. OSMAN PARLAKTUNA

Geri Dön