Geri Dön

Mixture model based data clustering

Karma model tabanlı kümeleme

  1. Tez No: 460979
  2. Yazar: CHIPO MUFUDZA
  3. Danışmanlar: Prof. Dr. GÜZİN YÜKSEL
  4. Tez Türü: Doktora
  5. Konular: İstatistik, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2017
  8. Dil: İngilizce
  9. Üniversite: Çukurova Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 158

Özet

Bu çalışma, bir popülasyondaki karmaşık heterojenlik özelliklerini araştıran kümeleme tekniklerine dayalı karma modellerin incelenmesi üze-rinde yoğunlaşmıştır. Hem parametrik hem de parametrik olmayan karma modeller farklı durumlarda incelenmiştir. Özellikle Poisson karma regresyon modelleri ve Sıfır ¸şişirilmiş Poisson karma modelleri parametrik durum için incelenirken Gauss çekirdek yoğunlukları da parametrik olmayan durum için incelenmiştir. Parametrik karmalar, kümeleri ve bile¸senleri aynı varsayarken, bunlar parametrik olmayan durum için voronoi diagramları ve sonsuz bile¸sen modelleri aracılığı ile grafik teori teknikleri kullanılarak farklı şekilde gözlemlendi. Karma modeller kullanılan daha iyi kümeleme yöntemleri kümeleme analizi yolu ile sınıflandırılarak belirlendi. Sonuçlara göre, parametrik ve parametrik olmayan karmalardaki kümelerin sayıları aynı olmalarına rağmen bu yaklaşımlar genellikle çok farklıdır. Parametrik olmayan karışılar, sınıflandırıcı performansını arttrıma ve dolayısıyla heterojeliği daha verimli bir şekilde sıkıştırma yenetenekler ile kanılandığı üzere daha iyi kümeler üretir. Bu nedenle, karma modellere, geleneksel kümeleme yönetemleri üzerindeki yoğunluklar ve parametreler yoluyla küme özelliklerinde çkarımlara izin verme yeteneği onları daha iyi kümeleme yönetemleri haline getirir. Parametrik olmayan karma daha sağlam, esnek ve daha iyi kümeler ürettikleri için parametrik olarak tercih edilmelidir

Özet (Çeviri)

The study focused on exploring the use of mixture models for data clustering techniques on data with complex heterogeneous properties. Both parametric and nonparametric mixture models were here considered. In particular, Poisson mixture regression models and Zero Inflated Poisson mixture models were applied and analysed for the parametric case as mixtures of Gaussian kernel densities were considered for the nonparametric case. Although, parametric mixtures assume clusters and components to be the same, these are observed different by either using graph theory techniques via voronoi diagrams or infinite componential models in the nonparametric case. Determination of better clustering method using mixture models was enabled through classification via clustering analysis. Results shows that although number of clusters from the parametric mixtures can be the same with nonparametric, these approaches are generally very different. Nonparametric mixtures produce better clusters as evidenced by their ability to improve classifier performance and hence compacting heterogeneity in a more efficiently way whilst parametric are a bit rigid. The ability by mixture models to allow inferences on cluster properties via densities and parameters over traditional clustering methods makes them a better clustering methods. We conclude that although mixture models are better than hierarchical models, nonparametric mixture should be preferred over parametric as they are more robust, flexible and produce better clusters.

Benzer Tezler

  1. The role of absorptive capacity on the effects of foreign direct investment on income inequality and productivity

    Özümseme kapasitesinin doğrudan yabancı yatırımın gelir eşitsizliği ve verimlilik üzerine etkilerindeki rolü

    BENGİ SARSILMAZ

    Doktora

    İngilizce

    İngilizce

    2024

    EkonomiHacettepe Üniversitesi

    İktisat (İngilizce) Ana Bilim Dalı

    PROF. DR. LÜTFİ ERDEN

  2. Çok değişkenli verilerin modele dayalı kümeleme analizinde kümeleme etkinliğinin arttırılması

    Improving effectiveness of clustering on model-based cluster analysis of multivariate data

    SERKAN AKOĞUL

    Doktora

    Türkçe

    Türkçe

    2018

    İstatistikSelçuk Üniversitesi

    İstatistik Ana Bilim Dalı

    DOÇ. DR. MURAT ERİŞOĞLU

  3. Development and implementations of fuzzy decision tree algorithms

    Bulanık karar ağacı algoritmalarının oluşturulması ve uygulamaları

    SUZAN KANTARCI SAVAŞ

    Doktora

    İngilizce

    İngilizce

    2017

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolDokuz Eylül Üniversitesi

    İstatistik Ana Bilim Dalı

    PROF. DR. EFENDİ NASİBOĞLU

  4. Veri madenciliğinde modele dayalı kümeleme analizi

    Model based cluster analysis in data mining

    İSMET BİRBİÇER

    Yüksek Lisans

    Türkçe

    Türkçe

    2017

    İstatistikÇukurova Üniversitesi

    İstatistik Ana Bilim Dalı

    PROF. DR. ALİ İHSAN GENÇ

  5. Novel machine learning-based approaches for customer segmentation and data analysis

    Müşteri segmentasyonu ve veri analizi için yeni nesil makine öğrenmesi yaklaşımları

    NUR DİYABİ

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBahçeşehir Üniversitesi

    Büyük Veri Analitiği ve Yönetimi Ana Bilim Dalı

    DOÇ. DR. ÖMER MELİH GÜL