Bulanık C- ortalamalar ve EM algoritması kullanarak bulanık kümeleme analizi
Fuzzy Culustering analysis using Fuzzy K-Means and EM algorithm
- Tez No: 730563
- Danışmanlar: PROF. DR. ZEKİ YILDIZ
- Tez Türü: Doktora
- Konular: İstatistik, Statistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: Türkçe
- Üniversite: Eskişehir Osmangazi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: İstatistik Ana Bilim Dalı
- Bilim Dalı: Uygulamalı İstatistik Bilim Dalı
- Sayfa Sayısı: 112
Özet
Kümeleme analizi, veri noktalarını bu noktaların özelliklerine göre belirli gruplara ayırmak için kullanılır. Klasik ve bulanık kümeleme olmak üzere iki tür kümeleme vardır. Klasik kümeleme analizinde, her veri noktasına bir veya sıfır üyeliği verilir, yani veri noktası yalnızca bir kümeye ait olabilirken, bulanık kümeleme analizinde veri noktaları aynı anda birden fazla kümeye ait olabilir. Sıfır ile bir arasında bir üyelik ağırlığına sahip olmaktadır. Kümeleme analizinde en çok bilinen ve yaygın olarak kullanılan algoritmalardan biri Gauss karışımı dayalı EM algoritmasıdır. Bu algoritma beklenti kısmı ve maksimizasyon kısmı olmak üzere iki ana kısımdan oluşmaktadır. Beklenti adımında, her bir kümeye ait olduğunu gösteren her noktanın ağırlığı hesaplanır, daha sonra maksimizasyon adımı bu ağırlıklarını kullanarak olabilirlik tahmin edicilerini maksimize ederek her küme için ortalama ve kovaryans matrisini güncellemek için bu ağırlıkları kullanır. Daha sonra bu yeni değerler beklenti adımına geçirilir ve yeni ağırlıkların hesaplanmasında kullanılır. Bu yinelemeli süreç, algoritma yakınsayana ve ortalama ile kovaryans matrisindeki değişiklik çok küçük olana kadar devam eder. Bu tezin amacı, bulanık C-ortalamalar algoritmasından elde edilen sonuçları EM algoritması için başlangıç değerlerini kullanarak Bulanık C-ortalamalar algoritmasından elde edilen sonuçlarda daha yüksek doğru sınıflandırma yüzdesi elde etmek için EM algoritmasını kullanmaktır. Önerilen algoritma (BCOEM), iris ve wine veri setlerine uygulanmış ve tek başına bulanık C-ortalamalar algoritmasının uygulanmasından elde edilen sonuçlarla karşılaştırıldığında daha iyi kümeleme analizi sonuçları verdiği ortaya konulmuştur. Ayrıca BCOEM ve Bulanık C-ortalamalar algoritmalarına ek olarak, simülasyon çalışmasında oluşturulan çeşitli veri setleri üzerinde Gustafson-Kessel ve Gath-Geva kümeleme algoritmaları uygulanmış ve çoğu durumda BCOEM'den elde edilen sınıflandırma yüzdesi, özellikle 500'den büyük birim içeren veri setleri için en iyisi olarak bulunmuştur.
Özet (Çeviri)
Clustering is used allocate data points to certain groups based on the properties of these points. There are two types of clustering, namely hard and fuzzy clustering. In hard clustering, each data point is given a membership of either one or zero, meaning that the data point can only belong to one cluster, on the other hand, data points in fuzzy clustering can belong to more than one cluster at a time by having a membership weight between zero and one. One of the most well-known and widely used algorithms in clustering is the Gaussian mixture based EM algorithm, this algorithm consists of two major parts, the Expectation part and the maximization part. In the expectation part, the responsibility of each point that indicates its belonging to each cluster is calculated, then the maximization step uses these responsibilities to update the values of the mean and the covariance matrix for each cluster by maximizing the likelihood estimators, then these new values are passed to expectation step and used to calculate the new responsibilities. This iterative process continues until the algorithm converges and the change in the mean and the covariance matrix becomes very small. The aim of this thesis is to use the results obtained from the fuzzy C-means algorithm as initial values for the EM algorithm to use the EM algorithm to obtain a higher percentage of correct classification in the results obtained from the Fuzzy C-means algorithm. The proposed algorithm (FCMEM) has been applied on the iris and wine data sets and was found to give better clustering results when compared with the results resulting from the application of the fuzzy C-means algorithm alone. Moreover, FCMEM and Fuzzy C-means algorithms, Gustafson-Kessel and Gath-Geva clustering algorithms were applied on various datasets created in the simulation study, and in most cases, the classification percentage obtained from BCOEM was the highest, especially for datasets containing more than 500 units found to be the best.
Benzer Tezler
- Hiperspektral görüntülerde spektral ve uzamsal enformasyonun ortaklaşa kullanımı ile sınıflandırılması ve bölütlenmesi
Classification and segmentation of hyperspectral images with joint usage of spectral and spatial information
UĞUR ERGÜL
Yüksek Lisans
Türkçe
2013
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. GÖKHAN BİLGİN
- Olive tree crown detection, delineation and counting by using image processing techniques
Görüntü işleme teknikleri kullanarak zeytin ağaçlarının tespit edilmesi, resmedilmesi ve sayımının yapılması
OMAR ALI ABBAS AL-TEKREETI
Yüksek Lisans
İngilizce
2021
Elektrik ve Elektronik MühendisliğiÇukurova ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. SAMİ ARICA
- Bulanık C-ortalamalar, olabilirlikli C-ortalamalar ve karma kümeleme algoritmalarının etkinliklerinin karşılaştırılması
Comparison of clustering performances of fuzzy C-means, possibilistic C-means and some fuzzy and possibilistic hybrid algorithms
ALPER TUNA KAVLAK
- Bulanık C-ortalamalar kümeleme algoritması kullanllarak araç tanıma
Vehicle detection using fuzzy C-means clustering algorithm
NOOSHIN NEMATI
Yüksek Lisans
Türkçe
2020
Elektrik ve Elektronik MühendisliğiVan Yüzüncü Yıl ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. RIDVAN SARAÇOĞLU
- Bulanık yerel bilgi c-ortalamalar algoritmasıyla histopatolojik görüntü bölütleme
Fuzzy local information c-means algorithm for histopathological image segmentation
MUSTAFA ÇETİN
Yüksek Lisans
Türkçe
2019
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. TAMER ÖLMEZ