Geri Dön

Bulanık C- ortalamalar ve EM algoritması kullanarak bulanık kümeleme analizi

Fuzzy Culustering analysis using Fuzzy K-Means and EM algorithm

  1. Tez No: 730563
  2. Yazar: MOHAMMED I. S. SOBOH
  3. Danışmanlar: PROF. DR. ZEKİ YILDIZ
  4. Tez Türü: Doktora
  5. Konular: İstatistik, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: Türkçe
  9. Üniversite: Eskişehir Osmangazi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: Uygulamalı İstatistik Bilim Dalı
  13. Sayfa Sayısı: 112

Özet

Kümeleme analizi, veri noktalarını bu noktaların özelliklerine göre belirli gruplara ayırmak için kullanılır. Klasik ve bulanık kümeleme olmak üzere iki tür kümeleme vardır. Klasik kümeleme analizinde, her veri noktasına bir veya sıfır üyeliği verilir, yani veri noktası yalnızca bir kümeye ait olabilirken, bulanık kümeleme analizinde veri noktaları aynı anda birden fazla kümeye ait olabilir. Sıfır ile bir arasında bir üyelik ağırlığına sahip olmaktadır. Kümeleme analizinde en çok bilinen ve yaygın olarak kullanılan algoritmalardan biri Gauss karışımı dayalı EM algoritmasıdır. Bu algoritma beklenti kısmı ve maksimizasyon kısmı olmak üzere iki ana kısımdan oluşmaktadır. Beklenti adımında, her bir kümeye ait olduğunu gösteren her noktanın ağırlığı hesaplanır, daha sonra maksimizasyon adımı bu ağırlıklarını kullanarak olabilirlik tahmin edicilerini maksimize ederek her küme için ortalama ve kovaryans matrisini güncellemek için bu ağırlıkları kullanır. Daha sonra bu yeni değerler beklenti adımına geçirilir ve yeni ağırlıkların hesaplanmasında kullanılır. Bu yinelemeli süreç, algoritma yakınsayana ve ortalama ile kovaryans matrisindeki değişiklik çok küçük olana kadar devam eder. Bu tezin amacı, bulanık C-ortalamalar algoritmasından elde edilen sonuçları EM algoritması için başlangıç değerlerini kullanarak Bulanık C-ortalamalar algoritmasından elde edilen sonuçlarda daha yüksek doğru sınıflandırma yüzdesi elde etmek için EM algoritmasını kullanmaktır. Önerilen algoritma (BCOEM), iris ve wine veri setlerine uygulanmış ve tek başına bulanık C-ortalamalar algoritmasının uygulanmasından elde edilen sonuçlarla karşılaştırıldığında daha iyi kümeleme analizi sonuçları verdiği ortaya konulmuştur. Ayrıca BCOEM ve Bulanık C-ortalamalar algoritmalarına ek olarak, simülasyon çalışmasında oluşturulan çeşitli veri setleri üzerinde Gustafson-Kessel ve Gath-Geva kümeleme algoritmaları uygulanmış ve çoğu durumda BCOEM'den elde edilen sınıflandırma yüzdesi, özellikle 500'den büyük birim içeren veri setleri için en iyisi olarak bulunmuştur.

Özet (Çeviri)

Clustering is used allocate data points to certain groups based on the properties of these points. There are two types of clustering, namely hard and fuzzy clustering. In hard clustering, each data point is given a membership of either one or zero, meaning that the data point can only belong to one cluster, on the other hand, data points in fuzzy clustering can belong to more than one cluster at a time by having a membership weight between zero and one. One of the most well-known and widely used algorithms in clustering is the Gaussian mixture based EM algorithm, this algorithm consists of two major parts, the Expectation part and the maximization part. In the expectation part, the responsibility of each point that indicates its belonging to each cluster is calculated, then the maximization step uses these responsibilities to update the values of the mean and the covariance matrix for each cluster by maximizing the likelihood estimators, then these new values are passed to expectation step and used to calculate the new responsibilities. This iterative process continues until the algorithm converges and the change in the mean and the covariance matrix becomes very small. The aim of this thesis is to use the results obtained from the fuzzy C-means algorithm as initial values for the EM algorithm to use the EM algorithm to obtain a higher percentage of correct classification in the results obtained from the Fuzzy C-means algorithm. The proposed algorithm (FCMEM) has been applied on the iris and wine data sets and was found to give better clustering results when compared with the results resulting from the application of the fuzzy C-means algorithm alone. Moreover, FCMEM and Fuzzy C-means algorithms, Gustafson-Kessel and Gath-Geva clustering algorithms were applied on various datasets created in the simulation study, and in most cases, the classification percentage obtained from BCOEM was the highest, especially for datasets containing more than 500 units found to be the best.

Benzer Tezler

  1. Hiperspektral görüntülerde spektral ve uzamsal enformasyonun ortaklaşa kullanımı ile sınıflandırılması ve bölütlenmesi

    Classification and segmentation of hyperspectral images with joint usage of spectral and spatial information

    UĞUR ERGÜL

    Yüksek Lisans

    Türkçe

    Türkçe

    2013

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. GÖKHAN BİLGİN

  2. Olive tree crown detection, delineation and counting by using image processing techniques

    Görüntü işleme teknikleri kullanarak zeytin ağaçlarının tespit edilmesi, resmedilmesi ve sayımının yapılması

    OMAR ALI ABBAS AL-TEKREETI

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    Elektrik ve Elektronik MühendisliğiÇukurova Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. SAMİ ARICA

  3. Bulanık C-ortalamalar, olabilirlikli C-ortalamalar ve karma kümeleme algoritmalarının etkinliklerinin karşılaştırılması

    Comparison of clustering performances of fuzzy C-means, possibilistic C-means and some fuzzy and possibilistic hybrid algorithms

    ALPER TUNA KAVLAK

    Yüksek Lisans

    Türkçe

    Türkçe

    2017

    ZiraatÇukurova Üniversitesi

    Zootekni Ana Bilim Dalı

    PROF. DR. ZEYNEL CEBECİ

  4. Bulanık C-ortalamalar kümeleme algoritması kullanllarak araç tanıma

    Vehicle detection using fuzzy C-means clustering algorithm

    NOOSHIN NEMATI

    Yüksek Lisans

    Türkçe

    Türkçe

    2020

    Elektrik ve Elektronik MühendisliğiVan Yüzüncü Yıl Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. RIDVAN SARAÇOĞLU

  5. Bulanık yerel bilgi c-ortalamalar algoritmasıyla histopatolojik görüntü bölütleme

    Fuzzy local information c-means algorithm for histopathological image segmentation

    MUSTAFA ÇETİN

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    PROF. DR. TAMER ÖLMEZ