Geri Dön

Kümeleme algoritmaları ve paralelleştirilmeleri

Clustering algorithms and their parallelization

  1. Tez No: 371440
  2. Yazar: CAN ATILGAN
  3. Danışmanlar: DOÇ. DR. BURAK ORDİN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Matematik, Computer Engineering and Computer Science and Control, Mathematics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2014
  8. Dil: Türkçe
  9. Üniversite: Ege Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Matematik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 97

Özet

Kümeleme (veya Küme Analizi), verilerin belirli bir benzerlik ölçütüne göre kümelere ayrılmasını amaçlayan bir veri analizi tekniğidir. Diğer bir deyişle, birbirine benzer verilerin bir arada yer aldığı homojen grupları belirleme işidir. Kümelemede ele alınan veri setleri genellikle çok büyüktür. Bu yüzden, geliştirilen yöntemlerin hızı, kümelemedeki başarısı kadar –kimi zaman daha fazla– öneme sahiptir. Her iki yönden de başarılı yöntemler var olsa da, işin doğası nedeniyle potansiyel işlem yükü hala ağırdır. Temel kümeleme algoritmaları seri bir makine modeliyle geliştirilmiştir ve modern bir bilgisayardan kapasitesinin altında verim sağlayabilirler. Bu handikapı aşmanın yolu, yöntemleri paralel hesaplamaya uygun hale getirmektir. Bu tezde, kümeleme yöntemleri ve paralel hesaplama araçları çeşitli açılardan incelenmiş, kümeleme başarısı yüksek iki algoritmanın paralel versiyonları önerilmiştir. Bu algoritmalar, C programlama dili ve OpenMP uygulama programlama arayüzü kullanılarak programlanmış ve alt programları barındıran bir kütüphane oluşturulmuştur. Önerilen yöntemler, teorik ve deneysel olarak analiz edilerek paralelleştirmenin etkisi gösterilmiştir.

Özet (Çeviri)

Clustering (or Cluster Analysis) is a data analysis technique that intends to cluster data according to some similarity measure. In other words, it is a task of identifying homogeneous groups consisting of analogous data. The data sets handled in clustering are usually very large. Thus, the speed of the developed methods is as important as –sometimes more important than– their clustering efficiency. Even though there are methods which are successful in both aspects, the potential work load remains heavy by the nature of the task. Fundamental clustering algorithms are developed using a serial machine model and can achieve a limited efficiency on a modern computer. The way to overcome this handicap is to tailor these methods for parallel computing. In this thesis, clustering methods and parallel computing tools are studied from various aspects, and parallel versions of two clustering algorithms with high clustering efficiency are proposed. These algorithms are then programmed using C programming language and OpenMP application programming interface, and a library containing the subprograms is organized. The effect of the parallelization is presented by theoretically and experimentally analyzing the proposed methods.

Benzer Tezler

  1. Veri madenciliğinde kümeleme algoritmaları ve kümeleme analizi

    Clustering algorithms in data mining and clustering analysis

    YASEMİN KOLDERE AKIN

    Doktora

    Türkçe

    Türkçe

    2008

    İstatistikMarmara Üniversitesi

    Ekonometri Ana Bilim Dalı

    PROF. DR. ŞAHAMET BÜLBÜL

  2. Merkez tabanlı kümeleme algoritmalarının karşılaştırılması

    The comparison a center-based clustering algorithms

    AYSEL BİLGİN

    Yüksek Lisans

    Türkçe

    Türkçe

    2008

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKocaeli Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. NEVCİHAN DURU

  3. Karma veriler üzerinde etkin kümeleme algoritmalarının geliştirilmesi

    Development of effective clustering algorithms on mixed data

    ELVIN NASIBOV

    Doktora

    Türkçe

    Türkçe

    2017

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEge Üniversitesi

    Matematik Ana Bilim Dalı

    DOÇ. DR. BURAK ORDİN

  4. Görüntü işleme yöntemlerini kullanarak kimyasal idrar görüntülerinin incelenmesi

    Investigation of chemical urine images using image processing methods

    AHMET TAŞKIRAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Elektrik ve Elektronik MühendisliğiErciyes Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ENİS GÜNAY

  5. Otel rezervasyon verilerine göre satış için müşteri profili belirleme

    Customer profile determination by hotel reservation data

    SALİH CANTEKİN

    Yüksek Lisans

    Türkçe

    Türkçe

    2020

    TurizmBahçeşehir Üniversitesi

    Bilgi Teknolojileri Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ BETÜL ERDOĞDU ŞAKAR