Geri Dön

Performance improvement on latency-bound parallel hpc applications by message sharing between processors

Gecikim-limitli paralel uygulamalarda işlemciler arası mesaj paylaşım yöntemiyle performans iyileştirme

  1. Tez No: 663109
  2. Yazar: MUSTAFA DUYMUŞ
  3. Danışmanlar: PROF. DR. CEVDET AYKANAT
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2021
  8. Dil: İngilizce
  9. Üniversite: İhsan Doğramacı Bilkent Üniversitesi
  10. Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 58

Özet

Paralelleştirilmiş Yüksek Performanslı Hesaplama (HPC) uygulamalarının başarımı, arka plandaki işlemci-işlemci iletişiminin verimliliğine bağlıdır. Gecikim-darboğazlı uygulamalarda performans, en fazla mesaj gönderen işlemci tarafından limitlenir. Gecikim ek yükünü düşürmek için en fazla mesaj gönderen işlemcinin başka bir işlemci ile eşlendiği iki-fazlı mesaj paylaşma-temelli bir algoritma önermekteyiz. Birinci fazda, en fazla mesaj gönderen işlemci, sistemdeki diğer işlemciler içerisinden en fazla ortak giden mesaja sahip olduğu işlemci ile eşlenir. İkinci fazda ise, en fazla mesaj gönderen işlemci, en az mesaj gönderen işlemci ile eşlenir. Her iki fazda da eşlenen işlemciler, ortak giden mesajları aralarında paylaşarak mesaj sayılarını düşürmektedir. Bu, özellikle de en fazla mesaj gönderen işlemcinin gönderdiği mesaj sayısını düşürmektedir. Çekirdek işlem olarak seyrek matris-vektör çarpımı kullanılmış ve testler 512 işlemcili bir sistemde yapılmıştır. Önerilen mesaj-paylaşma-temelli algoritma en fazla mesaj gönderen işlemcinin gönderdiği mesaj sayısında %84, sistemdeki toplam mesaj sayısında %60 düşüşe imkan tanımıştır.

Özet (Çeviri)

The performance of paralellized High Performance Computing (HPC) applications is tied to the efficiency of the underlying processor-to-processor communication. In latency-bound applications, the performance runs into bottleneck by the processor that is sending the maximum number of messages to the other processors. To reduce the latency overhead, we propose a two-phase message-sharing-based algorithm, where the bottleneck processor (the processor sending the maximum number of messages) is paired with another processor. In the first phase, the bottleneck processor is paired with the processor that has the maximum number of common outgoing messages. In the second phase, the bottleneck processor is paired with the processor that has the minimum number of outgoing messages. In both phases, the processor pair share the common outgoing messages between them, reducing their total number of outgoing messages, but especially the number of outgoing messages of the bottleneck processor. We use Sparse Matrix-Vector Multiplication as the kernel application and a 512-processor setting for the experiments. The proposed message-sharing algorithm achieves a reduction of 84% in the number of messages sent by the bottleneck processor and a reduction of 60% in the total number of messages in the system.

Benzer Tezler

  1. GPU üzerinde yazılım tabanlı anten gerçeklenmesi

    Realization of software-defined antenna on GPU

    ABDULLAH BAKIRTAŞ

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    PROF. DR. SELÇUK PAKER

  2. Energy aware endurance framework for mission critical aerial networks

    Güdümlü havasal ağlar için enerji farkında endürans modeli

    YUSUF ÖZÇEVİK

    Doktora

    İngilizce

    İngilizce

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. BERK CANBERK

  3. Performance and computational analysis of polarization-adjusted convolutional (PAC) codes

    Kutupsal ve polarizayson ayarlı evrişimli (PAC) kodlarının performans ve hesaplama analizi

    MOHSEN MORADI

    Doktora

    İngilizce

    İngilizce

    2022

    Elektrik ve Elektronik Mühendisliğiİhsan Doğramacı Bilkent Üniversitesi

    Elektrik ve Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. ERDAL ARIKAN

  4. A software defined network framework in 5G wireless systems

    5G kablosuz sistemlerde yazılım temelli ağ iskeleti

    GÖKHAN SEÇİNTİ

    Doktora

    İngilizce

    İngilizce

    2017

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. BERK CANBERK

  5. Performance improvement of the two dimensional broadcast-based distributed shared memory multiprocessor systems by message operations

    İki boyutlu yayım tabanlı dağıtık ortak hafızalı mikroişlemci sistemlerinin performansının mesaj operasyonları ile artırılması

    İPEK ABASIKELEŞ

    Doktora

    İngilizce

    İngilizce

    2013

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÇukurova Üniversitesi

    Elektrik ve Elektronik Mühendisliği Bölümü

    YRD. DOÇ. DR. MEHMET FATİH AKAY