Geri Dön

Tiling-based programming model for GPU clusters targeting structured grids

GPU'lu kümelenmiş sistemlerde yapısal çözüm alanı problemlerine yönelik bloklamaya dayalı programlama modeli

  1. Tez No: 547650
  2. Yazar: BURAK BASTEM
  3. Danışmanlar: DR. ÖĞR. ÜYESİ DİDEM UNAT
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2019
  8. Dil: İngilizce
  9. Üniversite: Koç Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 55

Özet

Günümüzde, TOP500 listesindeki süper bilgisayarların % 25'inden fazlası, büyük ölçüde paralel ve güç açısından verimli mimarileri nedeniyle GPU'ları kullanmaktadır. Ancak, büyük ölçekli bir sistemde GPU'ların verimli bir şekilde programlanması, yalnızca hesaplamalı bilim dalındaki insanlar için değil, aynı zamanda programlama uzmanları için de zorlu bir iştir çünkü bu işte GPU'ya özel kod üretilmeli, farklı bellekler yönetilmeli ve iletişim ele alınmalıdır. Bu gereksinimler üretkenliği azaltırken, uygulamanın taşınabilirliğini de sınırlar. Kod yönergeleriyle taşınabilirlik ve üretkenlik sunan OpenACC gibi direktif tabanlı programlama modelleri bulunmaktadır. Ancak bu modeller performansı iyileştirme amaçlı ayarlamalar gerektirir ve GPU'lu kümelenmiş sistemlerin programlanmasını desteklemezler. Kümelenmiş sistemlerde iletişimin verimli bir şekilde ele alınması gerekir. İletişimi ele alan ve GPU programlamayı kolaylaştırmak için iskelet tabanlı soyutlamalar sunan çalışmalar bulunmaktadır, ancak bu soyutlamalar programlamada yeterli esnekliği sağlayamazlar. Üstelik, literatürdeki çalışmaların çoğu, GPU'ları ana işlemciye bağlayan ara bağlantının bant genişliği kısıtını dikkate almamaktadır. Bazı görev tabanlı yaklaşımlar, bu kısıta çözüm olması amacıyla hesaplama ile örtüşen veri aktarımlarını kullanmaktadır fakat bu yaklaşımlarda programlayıcı GPU'ya özgü kodun yazılmasından ve görev zamanlamasından sorumludur. Programlama çabasını kolaylaştırmak, taşınabilirliği artırmak ve transferleri optimize etmek amacıyla GPU'lu kümelenmiş sistemlerde yürütülecek yapısal çözüm alanı problemleri için bloklamaya dayalı programlama modeli sunuyoruz. Model, üstü kapalı bir şekilde, TiDA ile veriyi ayrıştırır ve CUDA ile farklı bellekleri yönetir. CPU ve GPU'lar için tek tip bir arayüzün arkasında OpenACC'nin yönergelerinden yararlanarak otomatik bir şekilde GPU'ya has kod üretir. Ek olarak, veri aktarımlarını ve iletişimi yönetir ve bunları, CUDA akışları ve bloklamayan MPI rutinlerini kullanarak hesaplamalarla örtüştürür. Programlama modelinin etkinliğini bir ısı simülasyonu ve gerçek hayatta kullanılan bir kardiyak modellemesi üzerinde gösterdik. Sonuçlar, programlama modelinin iletişimi başarıyla örtüştürdüğünü ve iyi hızlanma sağladığını göstermektedir.

Özet (Çeviri)

Currently, more than 25\% of supercomputers in TOP500 list employ GPUs due to their massively parallel and power-efficient architectures. However, programming GPUs efficiently in a large-scale system is a demanding task not only for computational scientists but also for programming experts because it requires generating GPU-specific code, managing distinct address spaces and handling communication. While these requirements reduce productivity, they also limit the portability of the application. There are pragma-based programming models such as OpenACC offering portability and productivity with code annotations. However, they require performance tuning and lack support for programming GPU clusters. Handling communication efficiently is essential in the cluster environment. There are related works such as Cluster-SkePU handling communication and offering skeleton-based abstractions to ease GPU programming, but such abstractions arguably limit programming flexibility. Moreover, most of the works in the literature do not consider the bandwidth bottleneck of the interconnect that links GPUs to hosts. Some task-based approaches provide overlapping data transfers with computation as a solution to the interconnect bandwidth limit, but they hold programmer responsible for GPU-specific code and task scheduling. To ease the programming effort, increase the portability and optimize communication, we propose a tiling-based programming model for structured grid problems running on a GPU cluster. The model implicitly applies data decomposition with TiDA and manages distinct address spaces with CUDA. It automatically generates GPU-specific code itself by leveraging OpenACC annotations behind a uniform interface for CPUs and GPUs. Furthermore, it handles data transfers and communication and overlaps them with computation by exploiting CUDA streams and non-blocking MPI routines. We demonstrate the effectiveness of the programming model on a heat simulation and a real-life cardiac modeling. The results show that it successfully overlaps communication and achieves good speedup.

Benzer Tezler

  1. A vibration-based damage detection algorithm for bridge type structures

    Köprü tipi yapılar için titreşim tabanlı bir hasar tespit algoritması

    AHMED AL-QAYYIM

    Doktora

    İngilizce

    İngilizce

    2017

    İnşaat Mühendisliğiİstanbul Teknik Üniversitesi

    İnşaat Yapı ve Altyapı Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. BARLAS ÖZDEN ÇAĞLAYAN

  2. A computational approach to create aperiodic tilings through orthographic projection of the nd cube

    Çok boyutlu küpün ortografik projeksiyonu ile aperiyodik yüzey kaplamaları oluşturmaya hesaplamalı bir yaklaşım

    MERVE AKDOĞAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Mimarlıkİstanbul Teknik Üniversitesi

    Bilişim Ana Bilim Dalı

    DOÇ. DR. SEMA ALAÇAM

  3. Türkiye'deki konut projeleri için BIM tabanlı otomatik bina yönetmelik uygunluk kontrol modeli: BIMTRAC3

    A BIM based automated code compliance checking model for residential projects in Turkey: BIMTRAC3

    MURAT AYDIN

    Doktora

    Türkçe

    Türkçe

    2021

    Mimarlıkİstanbul Teknik Üniversitesi

    Mimarlık Ana Bilim Dalı

    PROF. DR. HAKAN YAMAN

  4. İleri teknolojili imalat sistemleri için yatırım değerlendirme modeli

    An Investment evaluation model for advanced manufacturing systems

    TUFAN VEHBİ KOÇ

    Doktora

    Türkçe

    Türkçe

    1992

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    PROF. DR. GÖNÜL YENERSOY

  5. Hastanelerde tıbbi cihaz planlaması: Ömür devrine dayalı bir model önerisi

    Medical device planning in hospitals: A life cycle based model suggestion

    BÜLENT SOYLULAR

    Doktora

    Türkçe

    Türkçe

    2024

    Sağlık YönetimiAnkara Üniversitesi

    Sağlık Kurumları Yönetimi Ana Bilim Dalı

    PROF. DR. AFSUN EZEL ESATOĞLU

    DR. ÖĞR. ÜYESİ UĞUR ELİİYİ