Data decomposition techniques for parallel tree-based K-means clustering
Ağaç tabanlı paralel K-ortalı gruplama için dağıtım veri teknikleri
- Tez No: 129181
- Danışmanlar: YRD. DOÇ. DR. ATTİLA GÜRSOY
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2002
- Dil: İngilizce
- Üniversite: İhsan Doğramacı Bilkent Üniversitesi
- Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 93
Özet
ÖZET AGAÇ TABANLI PARALEL K-ORTALI GRUPLAMA İÇİN VERİ DAĞITIM TEKNİKLERİ Cenk Şen Bilgisayar Mühendisliği, Yüksek Lisans Tez Yöneticisi: Yard. Doç. Dr. Attila Gürsoy Temmuz, 2002 K-ortalı gruplamada asıl olan hesaplama yükü veri vektörleri ile grupların ortalan arasındaki uzaklık hesaplamalarıdır. Veri vektörlerinin ve grup ortalarının sayılan arttırıldıkça, hesaplamaları tamamlamak için gerekli olan zaman artar. Bu hesaplama yükü yüksek performanslı bilgisayarlar ve/veya algoritmik gelişmeler gerektirir. Büyük veri kümelerini işlemek için dağınık hafizalı makinalardaki paralel ağaç tabanlı k-ortalı algoritması algoritmik iyileştirmeler ile paralel bilgisayarların yüksek hesaplama kapasitesini birleştirmiştir. Algoritmanın performansı veri dağıtım tekniğinden etkilenmektedir. Bu tezde, dağınık hafızalı makinalardaki paralel ağaç tabanlı k-ortalı algortimasının performansını arttıracak yeni bir veri dağıtım tekniği sunduk. Önerilen ağaç tabanlı dağıtım teknikleri işlemcilere sıkışık altalanlar vererek toplam uzaklık hesaplamalarının sayısını düşürmeyi amaçlamaktadır. Sıkışık altalanlar ağaç tabanlı k-ortalı algoritmasının budama fonksiyonunun performansını arttırmaktadır. Algoritmanın gerçekleştirilmesi ve performans deneyleri gruplandırılmış kişisel bilgisayarlar üzerinde yapılmıştır. Deney sonuçlanınız ağaç tabanlı dağıtım tekniğinin karışık dağıtım ve şeritvari dağıtım tekniklerinden daha iyi performansı olduğunu göstermiştir. Anahtar sözcükler : Gruplama, paralel algoritma, yük dengesi, veri dağıtımı. iv
Özet (Çeviri)
ABSTRACT DATA DECOMPOSITION TECHNIQUES FOR PARALLEL TREE-BASED K-MEANS CLUSTERING Cenk Şen M.S. in Computer Engineering Supervisor: Assist. Prof. Dr. Attila Gürsoy July, 2002 The main computation in the k-means clustering is distance calculations between cluster centroids and patterns. As the number of the patterns and the number of centroids increases, time needed to complete computations increased. This computational load requires high performance computers and/or algorithmic improvements. The parallel tree-based k-means algorithm on distributed memory machines combines the algorithmic improvements and high computation capacity of the parallel computers to deal with huge datasets. Its performance is affected by the data decomposition technique used. In this thesis, we presented novel data decomposition technique to improve the performance of the parallel tree-based k-means algorithm on distributed memory machines. Proposed tree-based decomposition techniques try to decrease the total number of the distance calculations by assigning processors compact subspaces. The compact subspace improves the performance of the pruning function of the tree-based k-means algorithm. We have implemented the algorithm and have conducted experiments on a PC cluster. Our experimental results demonstrated that the tree-based decomposition technique outperforms the random decomposition and stripwise decomposition techniques. Keywords : Clustering, parallel algorithm, load balancing, data decomposition. m
Benzer Tezler
- Application of gauss-seldel method and singular value decomposition techniques to recursive least squares algorithm
Başlık çevirisi yok
ATİLLA MALAŞ
Yüksek Lisans
İngilizce
1991
Elektrik ve Elektronik Mühendisliğiİhsan Doğramacı Bilkent ÜniversitesiPROF.DR. ÖMER MORGÜL
- Parallel solution of unsteady, incompressible three-dimensional Navier-Stokes equations with a new implicit method
Zamana bağlı, sıkıştırılamaz, üç boyutlu Navier-Stokes denklemlerinin yeni bir kapalı metodlar paralel çözümü
VİLDAN ÜSTOĞLU ÜNAL
Doktora
İngilizce
2003
Astronomi ve Uzay Bilimleriİstanbul Teknik ÜniversitesiAstronomi ve Uzay Bilimleri Ana Bilim Dalı
PROF. DR. ÜLGEN GÜLÇAT
- Generalized scattering matrix techniques for hybrid solutions of radiowave propagation problems
Radyodalgası yayılımı problemlerinin hibrit çözümlerine uygun genelleştirilmiş saçılma matrisi yöntemleri
ALİCAN UYSAL
Doktora
İngilizce
2024
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. FUNDA AKLEMAN YAPAR
- Real-time hybrid parallel rendering
Gerçek-zamanlı hibrid paralel tarama
MEHMET REHA CENANİ
Yüksek Lisans
İngilizce
2009
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolDoğuş ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. MİTHAT UYSAL
- Effect of pre-concentration technique on the extraction of volatile compounds in beef and changes in quality parameters under dynamic storage conditions
Çiğ etten uçucu bileşenlerin ekstraksiyonunda ön konsantrasyon tekniğinin etkisi ve dinamik muhafaza şartları altında kalite parametrelerinin değişimi
AYLİN MET ÖZYURT
Doktora
İngilizce
2018
Gıda Mühendisliğiİstanbul Teknik ÜniversitesiGıda Mühendisliği Ana Bilim Dalı
DOÇ. DR. NEŞE ŞAHİN YEŞİLÇUBUK