Tiling-based programming model for GPU clusters targeting structured grids
GPU'lu kümelenmiş sistemlerde yapısal çözüm alanı problemlerine yönelik bloklamaya dayalı programlama modeli
- Tez No: 547650
- Danışmanlar: DR. ÖĞR. ÜYESİ DİDEM UNAT
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2019
- Dil: İngilizce
- Üniversite: Koç Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 55
Özet
Günümüzde, TOP500 listesindeki süper bilgisayarların % 25'inden fazlası, büyük ölçüde paralel ve güç açısından verimli mimarileri nedeniyle GPU'ları kullanmaktadır. Ancak, büyük ölçekli bir sistemde GPU'ların verimli bir şekilde programlanması, yalnızca hesaplamalı bilim dalındaki insanlar için değil, aynı zamanda programlama uzmanları için de zorlu bir iştir çünkü bu işte GPU'ya özel kod üretilmeli, farklı bellekler yönetilmeli ve iletişim ele alınmalıdır. Bu gereksinimler üretkenliği azaltırken, uygulamanın taşınabilirliğini de sınırlar. Kod yönergeleriyle taşınabilirlik ve üretkenlik sunan OpenACC gibi direktif tabanlı programlama modelleri bulunmaktadır. Ancak bu modeller performansı iyileştirme amaçlı ayarlamalar gerektirir ve GPU'lu kümelenmiş sistemlerin programlanmasını desteklemezler. Kümelenmiş sistemlerde iletişimin verimli bir şekilde ele alınması gerekir. İletişimi ele alan ve GPU programlamayı kolaylaştırmak için iskelet tabanlı soyutlamalar sunan çalışmalar bulunmaktadır, ancak bu soyutlamalar programlamada yeterli esnekliği sağlayamazlar. Üstelik, literatürdeki çalışmaların çoğu, GPU'ları ana işlemciye bağlayan ara bağlantının bant genişliği kısıtını dikkate almamaktadır. Bazı görev tabanlı yaklaşımlar, bu kısıta çözüm olması amacıyla hesaplama ile örtüşen veri aktarımlarını kullanmaktadır fakat bu yaklaşımlarda programlayıcı GPU'ya özgü kodun yazılmasından ve görev zamanlamasından sorumludur. Programlama çabasını kolaylaştırmak, taşınabilirliği artırmak ve transferleri optimize etmek amacıyla GPU'lu kümelenmiş sistemlerde yürütülecek yapısal çözüm alanı problemleri için bloklamaya dayalı programlama modeli sunuyoruz. Model, üstü kapalı bir şekilde, TiDA ile veriyi ayrıştırır ve CUDA ile farklı bellekleri yönetir. CPU ve GPU'lar için tek tip bir arayüzün arkasında OpenACC'nin yönergelerinden yararlanarak otomatik bir şekilde GPU'ya has kod üretir. Ek olarak, veri aktarımlarını ve iletişimi yönetir ve bunları, CUDA akışları ve bloklamayan MPI rutinlerini kullanarak hesaplamalarla örtüştürür. Programlama modelinin etkinliğini bir ısı simülasyonu ve gerçek hayatta kullanılan bir kardiyak modellemesi üzerinde gösterdik. Sonuçlar, programlama modelinin iletişimi başarıyla örtüştürdüğünü ve iyi hızlanma sağladığını göstermektedir.
Özet (Çeviri)
Currently, more than 25\% of supercomputers in TOP500 list employ GPUs due to their massively parallel and power-efficient architectures. However, programming GPUs efficiently in a large-scale system is a demanding task not only for computational scientists but also for programming experts because it requires generating GPU-specific code, managing distinct address spaces and handling communication. While these requirements reduce productivity, they also limit the portability of the application. There are pragma-based programming models such as OpenACC offering portability and productivity with code annotations. However, they require performance tuning and lack support for programming GPU clusters. Handling communication efficiently is essential in the cluster environment. There are related works such as Cluster-SkePU handling communication and offering skeleton-based abstractions to ease GPU programming, but such abstractions arguably limit programming flexibility. Moreover, most of the works in the literature do not consider the bandwidth bottleneck of the interconnect that links GPUs to hosts. Some task-based approaches provide overlapping data transfers with computation as a solution to the interconnect bandwidth limit, but they hold programmer responsible for GPU-specific code and task scheduling. To ease the programming effort, increase the portability and optimize communication, we propose a tiling-based programming model for structured grid problems running on a GPU cluster. The model implicitly applies data decomposition with TiDA and manages distinct address spaces with CUDA. It automatically generates GPU-specific code itself by leveraging OpenACC annotations behind a uniform interface for CPUs and GPUs. Furthermore, it handles data transfers and communication and overlaps them with computation by exploiting CUDA streams and non-blocking MPI routines. We demonstrate the effectiveness of the programming model on a heat simulation and a real-life cardiac modeling. The results show that it successfully overlaps communication and achieves good speedup.
Benzer Tezler
- A vibration-based damage detection algorithm for bridge type structures
Köprü tipi yapılar için titreşim tabanlı bir hasar tespit algoritması
AHMED AL-QAYYIM
Doktora
İngilizce
2017
İnşaat Mühendisliğiİstanbul Teknik Üniversitesiİnşaat Yapı ve Altyapı Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. BARLAS ÖZDEN ÇAĞLAYAN
- A computational approach to create aperiodic tilings through orthographic projection of the nd cube
Çok boyutlu küpün ortografik projeksiyonu ile aperiyodik yüzey kaplamaları oluşturmaya hesaplamalı bir yaklaşım
MERVE AKDOĞAN
Yüksek Lisans
İngilizce
2019
Mimarlıkİstanbul Teknik ÜniversitesiBilişim Ana Bilim Dalı
DOÇ. DR. SEMA ALAÇAM
- Türkiye'deki konut projeleri için BIM tabanlı otomatik bina yönetmelik uygunluk kontrol modeli: BIMTRAC3
A BIM based automated code compliance checking model for residential projects in Turkey: BIMTRAC3
MURAT AYDIN
- İleri teknolojili imalat sistemleri için yatırım değerlendirme modeli
An Investment evaluation model for advanced manufacturing systems
TUFAN VEHBİ KOÇ
Doktora
Türkçe
1992
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiPROF. DR. GÖNÜL YENERSOY
- Hastanelerde tıbbi cihaz planlaması: Ömür devrine dayalı bir model önerisi
Medical device planning in hospitals: A life cycle based model suggestion
BÜLENT SOYLULAR
Doktora
Türkçe
2024
Sağlık YönetimiAnkara ÜniversitesiSağlık Kurumları Yönetimi Ana Bilim Dalı
PROF. DR. AFSUN EZEL ESATOĞLU
DR. ÖĞR. ÜYESİ UĞUR ELİİYİ