Geri Dön

Kernel probabilistic distance clustering algorithms

Çekirdek olasılıksal mesafe kümeleme algoritmaları

  1. Tez No: 745584
  2. Yazar: DİLAY ÖZKAN
  3. Danışmanlar: PROF. DR. CEM İYİGÜN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Endüstri ve Endüstri Mühendisliği, Industrial and Industrial Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Endüstri Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 118

Özet

Kümeleme, nesneler (veri noktaları) arasındaki benzerlikleri dikkate alarak verileri gruplayan gözetimsiz bir öğrenme yöntemidir. Olasılıksal Mesafe Kümelemesi (PDC), bazı ilkelere dayanan yumuşak bir kümeleme yaklaşımıdır. Bir nesneyi doğrudan bir kümeye atamak yerine, bunları üyelik olasılığı ile kümelere atar. PDC, küresel şekilli ve doğrusal olarak ayrılabilir veri kümelerinde iyi performans gösteren basit ama etkili bir kümeleme algoritmasıdır. Geleneksel kümeleme algoritmaları, PDC durumunda olduğu gibi, veri setleri küresel olmadığında veya doğrusal olarak ayrılamadığında başarısız olur. Çekirdek yöntemi, verilerin doğrusal olarak ayrılabilir olabileceği, doğrusal olmayan bir dönüşüm yoluyla verileri dolaylı olarak daha yüksek boyutlu bir uzaya eşleyerek bu sorunun üstesinden gelir. Bu çalışma, küresel olmayan veya doğrusal olarak ayrılamayan veri setlerinin kümelenmesi sorununun üstesinden gelmek için PDC ilkelerini kullanan çekirdek tabanlı kümeleme algoritmaları geliştirmeye odaklanır ve üç çekirdek tabanlı PDC algoritması önerir. Ayrıca, çekirdek kümelemede klasik yaklaşımdan farklı olarak Mahalanobis mesafesi de dikkate alınmış ve yumuşak çekirdek kümeleme tekniklerinde kullanılmak üzere yeni bir çekirdek tabanlı Mahalanobis mesafesi geliştirilmiştir. Önerilen çekirdek tabanlı PDC algoritmalarının performansını ölçmek için gerçek ve sentetik veri setleri için deneysel bir çalışma yapılmıştır.

Özet (Çeviri)

Clustering is an unsupervised learning method that groups data considering the similarities between objects (data points). Probabilistic Distance Clustering (PDC) is a soft clustering approach based on some principles. Instead of directly assigning an object to a cluster, it assigns them to clusters with a membership probability. PDC is a simple yet effective clustering algorithm that performs well on spherical-shaped and linearly separable data sets. Traditional clustering algorithms fail when the data set is non-spherical or non-linearly separable, as in the case of PDC. The kernel method overcomes this problem by implicitly mapping the data into a higher dimensional space via a nonlinear transformation, where the data may be linearly separable. This study focuses on developing kernel-based clustering algorithms using the principles of PDC to overcome the problem of clustering non-spherical or non-linearly separable data sets and proposes three kernel-based PDC algorithms. In addition, different than the classical approach, Mahalanobis distance is also considered in kernel clustering, and a new kernel-based Mahalanobis distance is developed to be used in soft kernel clustering techniques. An experimental study is conducted for real and synthetic data sets to measure the performance of the proposed kernel-based PDC algorithms.

Benzer Tezler

  1. Metin sınıflama için yeni bir özellik çıkarım yöntemi

    A new method on feature extraction for text classification

    GÖKSEL BİRİCİK

    Doktora

    Türkçe

    Türkçe

    2011

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. A. COŞKUN SÖNMEZ

  2. A new outlier detection method based on probabilistic outputs of support vector machines in binary classification

    İkili sınıflama probleminde aykırı gözlem tespiti için destek vektör makineleri olasılıksal çıktılarına dayalı yeni bir yöntem

    HABIB CEESAY

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    İstatistikGazi Üniversitesi

    İstatistik Ana Bilim Dalı

    DOÇ. DR. FİLİZ KARDİYEN

  3. A comparative evaluation for liver segmentation from spir images and a novel level set method using signed pressure force function

    Spir görüntülerinden karaciğer bölütlemenin karşılaştırmalı değerlendirilmesi ve işaretli baskı kuvvet fonksiyonu kullanan yeni bir düzey kümesi yöntemi

    EVGİN GÖÇERİ

    Doktora

    İngilizce

    İngilizce

    2013

    Elektrik ve Elektronik Mühendisliğiİzmir Yüksek Teknoloji Enstitüsü

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. MEHMET ZÜBEYİR ÜNLÜ

  4. Multiple kernel learning for first-person activity recognition

    Birinci şahıs aktivite tanıma için çoklu çekirdek öğrenmesi

    FATİH ÖZKAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2017

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Bilişim Sistemleri Ana Bilim Dalı

    DOÇ. DR. ALPTEKİN TEMİZEL

    YRD. DOÇ. DR. ELİF SÜRER

  5. Monte Carlo simulasyonu ve kernel yoğunluk tahminleme yöntemlerinin birbirlerine entegre edilmesiyle şev duraylılığında etkili kaya kütle parametresinin tespiti

    Determination of effective rock mass parameter in slope stability by integrating the Monte Carlo simulation and kernel density estimation methods

    GÖRKEM ERTUĞRUL

    Doktora

    Türkçe

    Türkçe

    2021

    Maden Mühendisliği ve MadencilikKütahya Dumlupınar Üniversitesi

    Maden Mühendisliği Ana Bilim Dalı

    PROF. DR. HAKAN AYKUL

    PROF. DR. ALPARSLAN TURANBOY