Geri Dön

Extending the GPU memory architecture for efficientbandwidth reservation

Başlık çevirisi mevcut değil.

  1. Tez No: 718623
  2. Yazar: EMİR CAN MARANGOZ
  3. Danışmanlar: Belirtilmemiş.
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2020
  8. Dil: İngilizce
  9. Üniversite: State University of New York at Binghamton
  10. Enstitü: Yurtdışı Enstitü
  11. Ana Bilim Dalı: Belirtilmemiş.
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 52

Özet

Özet yok.

Özet (Çeviri)

The trend of growing GPU capacity necessitates the support for concurrent executions of multiple applications in a GPU since a single application cannot fully utilize hardware resources. Interference between the co-running applications, however, increases non-deterministic timing behaviors. Achieving performance isolation under multi-application execution plays a key role to reduce the non-determinism. A powerful approach is strict resource partitioning that divides hardware resources into several partitions and assigns a partition to each application exclusively. However, we observe that strict resource partitioning erases crucial optimization opportunities to improve GPU utilization, leading to a significant performance decline. Notably, we find that one of the most underutilized resources are GPU memory bandwidth, and it requires more flexible resource sharing. Meanwhile, we also find that keeping other shared resources, such as an L2 cache, strictly partitioned is often beneficial. Based on our observations, we propose an extension of the GPU memory architecture to support bandwidth reservation. Unlike strict resource partitioning that tries to remove all potential interference between co-running applications, the proposed bandwidth reservation method supports flexible resource sharing, while reserving the required GPU memory bandwidth for each application. Further, our design supports partitioning of other essential resources in the GPU memory hierarchy. Our experimental results show that our approach supports the required memory bandwidth reservation for each application and improves the performance of concurrent applications by 20% on average, compared to strict partitioning of hardware resources.

Benzer Tezler

  1. İkili ağırlıklı ağ ve XNOR-ağ ikilileştirilmiş evrişimsel derin sinir ağlarının analizi

    Analysis of binary weighted network and XNOR-net binarized convolutional deep neural networks

    EMİR ALİ DİNSEL

    Yüksek Lisans

    Türkçe

    Türkçe

    2020

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKonya Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. HALİFE KODAZ

  2. Autonomous execution for multi-GPU systems: CPU-free blueprint and compiler support

    Çoklu GPU sistemleri için otonom yürütme: CPU'suz tasarım ve derleyici desteği

    JAVID BAYDAMIRLI

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKoç Üniversitesi

    Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı

    Assoc. Prof. Dr. DİDEM UNAT ERTEN

  3. Development of high-order harmonic generation code using Cuda

    GPU üzerinde Cuda'yı kullanarak yüksek harmonik üretimi kodu geliştirmek

    OZAN OĞUZ

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Fizik ve Fizik MühendisliğiMarmara Üniversitesi

    Fizik Ana Bilim Dalı

    DOÇ. DR. ERDİ ATA BLEDA

  4. FPGA based hardware accelerator for euler equations with finite volume method

    Euler denklemleri için sonlu hacimler yöntemi ile FPGA tabanlı donanım hızlandırıcı

    EMİNE ELİF YİĞİT

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Savunma Teknolojileri Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ RAMAZAN YENİÇERİ

  5. Satellite images super resolution using generative adversarial networks

    Uydu görüntülerinde çekişmeli üretici ağ kullanarak süper çözünürlük

    MARYAM SERDAR

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    İletişim Sistemleri Ana Bilim Dalı

    PROF. DR. AHMET HAMDİ KAYRAN