Geri Dön

Data decomposition techniques for parallel tree-based K-means clustering

Ağaç tabanlı paralel K-ortalı gruplama için dağıtım veri teknikleri

  1. Tez No: 129181
  2. Yazar: CENK ŞEN
  3. Danışmanlar: YRD. DOÇ. DR. ATTİLA GÜRSOY
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2002
  8. Dil: İngilizce
  9. Üniversite: İhsan Doğramacı Bilkent Üniversitesi
  10. Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 93

Özet

ÖZET AGAÇ TABANLI PARALEL K-ORTALI GRUPLAMA İÇİN VERİ DAĞITIM TEKNİKLERİ Cenk Şen Bilgisayar Mühendisliği, Yüksek Lisans Tez Yöneticisi: Yard. Doç. Dr. Attila Gürsoy Temmuz, 2002 K-ortalı gruplamada asıl olan hesaplama yükü veri vektörleri ile grupların ortalan arasındaki uzaklık hesaplamalarıdır. Veri vektörlerinin ve grup ortalarının sayılan arttırıldıkça, hesaplamaları tamamlamak için gerekli olan zaman artar. Bu hesaplama yükü yüksek performanslı bilgisayarlar ve/veya algoritmik gelişmeler gerektirir. Büyük veri kümelerini işlemek için dağınık hafizalı makinalardaki paralel ağaç tabanlı k-ortalı algoritması algoritmik iyileştirmeler ile paralel bilgisayarların yüksek hesaplama kapasitesini birleştirmiştir. Algoritmanın performansı veri dağıtım tekniğinden etkilenmektedir. Bu tezde, dağınık hafızalı makinalardaki paralel ağaç tabanlı k-ortalı algortimasının performansını arttıracak yeni bir veri dağıtım tekniği sunduk. Önerilen ağaç tabanlı dağıtım teknikleri işlemcilere sıkışık altalanlar vererek toplam uzaklık hesaplamalarının sayısını düşürmeyi amaçlamaktadır. Sıkışık altalanlar ağaç tabanlı k-ortalı algoritmasının budama fonksiyonunun performansını arttırmaktadır. Algoritmanın gerçekleştirilmesi ve performans deneyleri gruplandırılmış kişisel bilgisayarlar üzerinde yapılmıştır. Deney sonuçlanınız ağaç tabanlı dağıtım tekniğinin karışık dağıtım ve şeritvari dağıtım tekniklerinden daha iyi performansı olduğunu göstermiştir. Anahtar sözcükler : Gruplama, paralel algoritma, yük dengesi, veri dağıtımı. iv

Özet (Çeviri)

ABSTRACT DATA DECOMPOSITION TECHNIQUES FOR PARALLEL TREE-BASED K-MEANS CLUSTERING Cenk Şen M.S. in Computer Engineering Supervisor: Assist. Prof. Dr. Attila Gürsoy July, 2002 The main computation in the k-means clustering is distance calculations between cluster centroids and patterns. As the number of the patterns and the number of centroids increases, time needed to complete computations increased. This computational load requires high performance computers and/or algorithmic improvements. The parallel tree-based k-means algorithm on distributed memory machines combines the algorithmic improvements and high computation capacity of the parallel computers to deal with huge datasets. Its performance is affected by the data decomposition technique used. In this thesis, we presented novel data decomposition technique to improve the performance of the parallel tree-based k-means algorithm on distributed memory machines. Proposed tree-based decomposition techniques try to decrease the total number of the distance calculations by assigning processors compact subspaces. The compact subspace improves the performance of the pruning function of the tree-based k-means algorithm. We have implemented the algorithm and have conducted experiments on a PC cluster. Our experimental results demonstrated that the tree-based decomposition technique outperforms the random decomposition and stripwise decomposition techniques. Keywords : Clustering, parallel algorithm, load balancing, data decomposition. m

Benzer Tezler

  1. Parallel solution of unsteady, incompressible three-dimensional Navier-Stokes equations with a new implicit method

    Zamana bağlı, sıkıştırılamaz, üç boyutlu Navier-Stokes denklemlerinin yeni bir kapalı metodlar paralel çözümü

    VİLDAN ÜSTOĞLU ÜNAL

    Doktora

    İngilizce

    İngilizce

    2003

    Astronomi ve Uzay Bilimleriİstanbul Teknik Üniversitesi

    Astronomi ve Uzay Bilimleri Ana Bilim Dalı

    PROF. DR. ÜLGEN GÜLÇAT

  2. Generalized scattering matrix techniques for hybrid solutions of radiowave propagation problems

    Radyodalgası yayılımı problemlerinin hibrit çözümlerine uygun genelleştirilmiş saçılma matrisi yöntemleri

    ALİCAN UYSAL

    Doktora

    İngilizce

    İngilizce

    2024

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    PROF. DR. FUNDA AKLEMAN YAPAR

  3. Real-time hybrid parallel rendering

    Gerçek-zamanlı hibrid paralel tarama

    MEHMET REHA CENANİ

    Yüksek Lisans

    İngilizce

    İngilizce

    2009

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolDoğuş Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. MİTHAT UYSAL

  4. Effect of pre-concentration technique on the extraction of volatile compounds in beef and changes in quality parameters under dynamic storage conditions

    Çiğ etten uçucu bileşenlerin ekstraksiyonunda ön konsantrasyon tekniğinin etkisi ve dinamik muhafaza şartları altında kalite parametrelerinin değişimi

    AYLİN MET ÖZYURT

    Doktora

    İngilizce

    İngilizce

    2018

    Gıda Mühendisliğiİstanbul Teknik Üniversitesi

    Gıda Mühendisliği Ana Bilim Dalı

    DOÇ. DR. NEŞE ŞAHİN YEŞİLÇUBUK