Geri Dön

An automated framework for concurrent graph processing on GPU

Eşzamanlı grafik işleme için otomatik GPU çerçevesi

  1. Tez No: 877543
  2. Yazar: MANDANA BAGHERIMARZIJARANI
  3. Danışmanlar: DOÇ. DR. DİDEM UNAT ERTEN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: İngilizce
  9. Üniversite: Koç Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 80

Özet

GPU'lar, yapay zeka ve bilimsel hesaplamalar için kullanılan yüksek performanslı sistemlerde son teknoloji haline geldi. GPU'larda paralel işler ve algoritmalar çalıştırmak, aynı işleri daha az çekirdek kullanan CPU'larda çalıştırmaktan çok daha hızlı sonuçlar verir. Hesaplamalı görevlerin önemli bir kısmı, grafik geçişlerini ve büyük grafiklerin geçişiyle ilişkili hesaplamaları içerir. Bu görevler ya doğası gereği grafik geçiş görevleridir ya da basitleştirilmiş veya grafik geçiş görevlerine dönüştürülmüştür. Çekirdek füzyonu, performanslarının optimize edilebilmesi için hesaplama çekirdeklerin paralel işlerde birleştirilmesinin bir yolu olarak çeşitli araştırma gruplarında önerilmiştir. Spesifik olarak çekirdek füzyonu, aynı grafik düğümlerine ve ilgili bellek bölgelerine birden fazla paralel iş tarafından yapılan erişimleri birleştirmek için kullanılır, böylece bellek önbellekleri daha verimli kullanılır ve bu da performans iyileştirmesiyle sonuçlanır. Çekirdek füzyonunun temel fikri, birden fazla işin kullanımını artırmak için kaynak erişimini paylaşmak olduğundan, yüzlerce işi paralel olarak çalıştıran GPU'lar için, birkaç işi paralel olarak çalıştıran CPU'lardan bile daha uygundur. Bununla birlikte, çekirdek füzyonu, kontrol akışı değişikliklerini ve hesaplamalı işler için yürütme sırasının manipülasyonunu içeren, hesaplama açısından pahalı bir işlemdir. Bu nedenle, çekirdek füzyonunun GPU'larda kullanılması CPU'lara kıyasla daha zordur. Bu çalışma, GPU'larda eşzamanlı grafik işleme için geliştirilmiş bir çekirdek füzyon çerçevesi sunmaktadır. Çerçeve, GPU'larda paralel olarak yürütülebilen ve daha iyi performans elde etmek için çerçevede uygulanan çekirdek füzyon algoritması tarafından otomatik olarak birleştirilen grafik işlerinin tanımlanmasına ve uygulanmasına olanak tanır. Çerçeve aynı zamanda yeni veri işleme yapılarının yanı sıra, tipik polimorfizmle ilişkili performans düşüşleri olmadan GPU'da bir iş kuyruğu olarak birden fazla farklı işi çalıştırmak için statik polimorfizm sağlayan bir meta derleyiciyi de içeriyor. Bu tez, dört ortak grafik işi (BFS, SSSP, PageRank, Label Propagation) tanımlanarak ve bu işlerin 200'e kadar paralel örneğinin çekirdek füzyonu ile ve çekirdek füzyonu olmadan homojen ve heterojen şekillerde çalıştırılmasıyla kapsamlı bir şekilde çerçeveyi değerlendirir. Değerlendirmeler, iş paralelliği makul derecede yüksek olduğunda (yani 10'dan fazla paralel iş) çekirdek füzyonunun yaklaşık %5 ila %10 performans artışı sağladığını göstermektedir.

Özet (Çeviri)

GPUs have become the bleeding edge in high-performance systems used for artificial intelligence and scientific computations. Running parallel jobs and algorithms on GPUs yields results that are orders of magnitude faster than running the same jobs on CPUs that employ fewer cores. A significant body of computational tasks incorporates graph traversals and computations associated with traversal of large graphs. These tasks are either graph traversal tasks in nature or are simplified or transformed into graph traversal tasks. Kernel fusion has been proposed in several bodies of research as a means of fusing computation cores (kernels) in parallel jobs so that the performance can be optimized. Specifically, kernel fusion is used to fuse accesses to same graph nodes and corresponding regions of memory by multiple parallel jobs so that memory caches are more efficiently utilized, resulting in performance improvements. As kernel fusion's fundamental idea is sharing resource access to increase utilization by multiple jobs, it is even better suited for GPUs that run hundreds of jobs in parallel than CPUs that run a few jobs in parallel. However, kernel fusion is a computationally expensive operation that incorporates control flow changes and manipulation of the order of execution for computational jobs. As such, kernel fusion is harder to utilize on GPUs compared to CPUs. This work introduces a streamlined kernel fusion framework for concurrent graph processing on GPUs. The framework enables definition and implementation of graph jobs that can be executed in parallel in GPUs, and are automatically fused by the kernel fusion algorithm implemented in the framework, to achieve better performance. The framework also introduces novel data handling structures, as well as a meta-compiler that enables static polymorphism for running multiple different jobs as a job queue on the GPU, without performance hits that are associated with typical polymorphism. The framework is then extensively evaluated by defining four common graph jobs (BFS, SSSP, PageRank, Label Propagation) and running up to 200 parallel instances of these jobs in homogeneous and heterogeneous manners, with and without kernel fusion. The evaluations show that kernel fusion provides about 5% to 10% performance improvement when job parallelism is reasonably high (i.e., more than 10 parallel jobs).

Benzer Tezler

  1. Real-time performance diagnosis and evaluation of big data systems in cloud datacenters

    Bulut veri merkezlerinde büyük veri sistemlerinin gerçek zamanlı performans teşhisi ve değerlendirilmesi

    ÜMİT DEMİRBAGA

    Doktora

    İngilizce

    İngilizce

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolNewcastle University

    Bilgisayar Bilimleri Ana Bilim Dalı

    PROF. DR. RAJIV RANJAN

  2. Multi-robot systems in cognitive factories: representation, reasoning, execution and monitoring

    Bilişsel fabrikalarda çoklu-robot sistemleri: Gösterim, akıl yürütme, icra ve takibi

    KADİR HASPALAMUTGİL

    Yüksek Lisans

    İngilizce

    İngilizce

    2011

    Mühendislik BilimleriSabancı Üniversitesi

    Mühendislik Bilimleri Ana Bilim Dalı

    YRD. DOÇ. DR. ESRA ERDEM

    YRD. DOÇ. DR. VOLKAN PATOĞLU

  3. Depresyondaki düşünce bozukluklarının bilişsel kuram açısından incelenmesi

    An Investigation of cognitive distortions in depression

    GÜLER AYTAR

    Doktora

    Türkçe

    Türkçe

    1987

    Psikiyatriİstanbul Üniversitesi

    Psikiyatri Ana Bilim Dalı

    PROF. DR. ÖZCAN KÖKNEL

  4. Türk basınında düzensiz göçün görsel temsili: Taliban yönetimi sonrası Afgan göçü

    Visual representation of irregular migration in the Turkish press: Afghan migration after the Taliban regime

    ZİNDAN ÇAKICI

    Doktora

    Türkçe

    Türkçe

    2024

    GazetecilikGalatasaray Üniversitesi

    Radyo Televizyon ve Sinema Ana Bilim Dalı

    DOÇ. DR. EMİNE NAZLI AYTUNA

  5. 5G technology implementation on process performance in production

    Başlık çevirisi yok

    WASEEM KHALEEL JALIL ALADEEB

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAltınbaş Üniversitesi

    Elektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. OSMAN NURİ UÇAN