An automated framework for concurrent graph processing on GPU
Eşzamanlı grafik işleme için otomatik GPU çerçevesi
- Tez No: 877543
- Danışmanlar: DOÇ. DR. DİDEM UNAT ERTEN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: İngilizce
- Üniversite: Koç Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 80
Özet
GPU'lar, yapay zeka ve bilimsel hesaplamalar için kullanılan yüksek performanslı sistemlerde son teknoloji haline geldi. GPU'larda paralel işler ve algoritmalar çalıştırmak, aynı işleri daha az çekirdek kullanan CPU'larda çalıştırmaktan çok daha hızlı sonuçlar verir. Hesaplamalı görevlerin önemli bir kısmı, grafik geçişlerini ve büyük grafiklerin geçişiyle ilişkili hesaplamaları içerir. Bu görevler ya doğası gereği grafik geçiş görevleridir ya da basitleştirilmiş veya grafik geçiş görevlerine dönüştürülmüştür. Çekirdek füzyonu, performanslarının optimize edilebilmesi için hesaplama çekirdeklerin paralel işlerde birleştirilmesinin bir yolu olarak çeşitli araştırma gruplarında önerilmiştir. Spesifik olarak çekirdek füzyonu, aynı grafik düğümlerine ve ilgili bellek bölgelerine birden fazla paralel iş tarafından yapılan erişimleri birleştirmek için kullanılır, böylece bellek önbellekleri daha verimli kullanılır ve bu da performans iyileştirmesiyle sonuçlanır. Çekirdek füzyonunun temel fikri, birden fazla işin kullanımını artırmak için kaynak erişimini paylaşmak olduğundan, yüzlerce işi paralel olarak çalıştıran GPU'lar için, birkaç işi paralel olarak çalıştıran CPU'lardan bile daha uygundur. Bununla birlikte, çekirdek füzyonu, kontrol akışı değişikliklerini ve hesaplamalı işler için yürütme sırasının manipülasyonunu içeren, hesaplama açısından pahalı bir işlemdir. Bu nedenle, çekirdek füzyonunun GPU'larda kullanılması CPU'lara kıyasla daha zordur. Bu çalışma, GPU'larda eşzamanlı grafik işleme için geliştirilmiş bir çekirdek füzyon çerçevesi sunmaktadır. Çerçeve, GPU'larda paralel olarak yürütülebilen ve daha iyi performans elde etmek için çerçevede uygulanan çekirdek füzyon algoritması tarafından otomatik olarak birleştirilen grafik işlerinin tanımlanmasına ve uygulanmasına olanak tanır. Çerçeve aynı zamanda yeni veri işleme yapılarının yanı sıra, tipik polimorfizmle ilişkili performans düşüşleri olmadan GPU'da bir iş kuyruğu olarak birden fazla farklı işi çalıştırmak için statik polimorfizm sağlayan bir meta derleyiciyi de içeriyor. Bu tez, dört ortak grafik işi (BFS, SSSP, PageRank, Label Propagation) tanımlanarak ve bu işlerin 200'e kadar paralel örneğinin çekirdek füzyonu ile ve çekirdek füzyonu olmadan homojen ve heterojen şekillerde çalıştırılmasıyla kapsamlı bir şekilde çerçeveyi değerlendirir. Değerlendirmeler, iş paralelliği makul derecede yüksek olduğunda (yani 10'dan fazla paralel iş) çekirdek füzyonunun yaklaşık %5 ila %10 performans artışı sağladığını göstermektedir.
Özet (Çeviri)
GPUs have become the bleeding edge in high-performance systems used for artificial intelligence and scientific computations. Running parallel jobs and algorithms on GPUs yields results that are orders of magnitude faster than running the same jobs on CPUs that employ fewer cores. A significant body of computational tasks incorporates graph traversals and computations associated with traversal of large graphs. These tasks are either graph traversal tasks in nature or are simplified or transformed into graph traversal tasks. Kernel fusion has been proposed in several bodies of research as a means of fusing computation cores (kernels) in parallel jobs so that the performance can be optimized. Specifically, kernel fusion is used to fuse accesses to same graph nodes and corresponding regions of memory by multiple parallel jobs so that memory caches are more efficiently utilized, resulting in performance improvements. As kernel fusion's fundamental idea is sharing resource access to increase utilization by multiple jobs, it is even better suited for GPUs that run hundreds of jobs in parallel than CPUs that run a few jobs in parallel. However, kernel fusion is a computationally expensive operation that incorporates control flow changes and manipulation of the order of execution for computational jobs. As such, kernel fusion is harder to utilize on GPUs compared to CPUs. This work introduces a streamlined kernel fusion framework for concurrent graph processing on GPUs. The framework enables definition and implementation of graph jobs that can be executed in parallel in GPUs, and are automatically fused by the kernel fusion algorithm implemented in the framework, to achieve better performance. The framework also introduces novel data handling structures, as well as a meta-compiler that enables static polymorphism for running multiple different jobs as a job queue on the GPU, without performance hits that are associated with typical polymorphism. The framework is then extensively evaluated by defining four common graph jobs (BFS, SSSP, PageRank, Label Propagation) and running up to 200 parallel instances of these jobs in homogeneous and heterogeneous manners, with and without kernel fusion. The evaluations show that kernel fusion provides about 5% to 10% performance improvement when job parallelism is reasonably high (i.e., more than 10 parallel jobs).
Benzer Tezler
- Real-time performance diagnosis and evaluation of big data systems in cloud datacenters
Bulut veri merkezlerinde büyük veri sistemlerinin gerçek zamanlı performans teşhisi ve değerlendirilmesi
ÜMİT DEMİRBAGA
Doktora
İngilizce
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolNewcastle UniversityBilgisayar Bilimleri Ana Bilim Dalı
PROF. DR. RAJIV RANJAN
- Multi-robot systems in cognitive factories: representation, reasoning, execution and monitoring
Bilişsel fabrikalarda çoklu-robot sistemleri: Gösterim, akıl yürütme, icra ve takibi
KADİR HASPALAMUTGİL
Yüksek Lisans
İngilizce
2011
Mühendislik BilimleriSabancı ÜniversitesiMühendislik Bilimleri Ana Bilim Dalı
YRD. DOÇ. DR. ESRA ERDEM
YRD. DOÇ. DR. VOLKAN PATOĞLU
- Depresyondaki düşünce bozukluklarının bilişsel kuram açısından incelenmesi
An Investigation of cognitive distortions in depression
GÜLER AYTAR
- Türk basınında düzensiz göçün görsel temsili: Taliban yönetimi sonrası Afgan göçü
Visual representation of irregular migration in the Turkish press: Afghan migration after the Taliban regime
ZİNDAN ÇAKICI
Doktora
Türkçe
2024
GazetecilikGalatasaray ÜniversitesiRadyo Televizyon ve Sinema Ana Bilim Dalı
DOÇ. DR. EMİNE NAZLI AYTUNA
- 5G technology implementation on process performance in production
Başlık çevirisi yok
WASEEM KHALEEL JALIL ALADEEB
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAltınbaş ÜniversitesiElektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. OSMAN NURİ UÇAN