Performance improvement on latency-bound parallel hpc applications by message sharing between processors
Gecikim-limitli paralel uygulamalarda işlemciler arası mesaj paylaşım yöntemiyle performans iyileştirme
- Tez No: 663109
- Danışmanlar: PROF. DR. CEVDET AYKANAT
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2021
- Dil: İngilizce
- Üniversite: İhsan Doğramacı Bilkent Üniversitesi
- Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 58
Özet
Paralelleştirilmiş Yüksek Performanslı Hesaplama (HPC) uygulamalarının başarımı, arka plandaki işlemci-işlemci iletişiminin verimliliğine bağlıdır. Gecikim-darboğazlı uygulamalarda performans, en fazla mesaj gönderen işlemci tarafından limitlenir. Gecikim ek yükünü düşürmek için en fazla mesaj gönderen işlemcinin başka bir işlemci ile eşlendiği iki-fazlı mesaj paylaşma-temelli bir algoritma önermekteyiz. Birinci fazda, en fazla mesaj gönderen işlemci, sistemdeki diğer işlemciler içerisinden en fazla ortak giden mesaja sahip olduğu işlemci ile eşlenir. İkinci fazda ise, en fazla mesaj gönderen işlemci, en az mesaj gönderen işlemci ile eşlenir. Her iki fazda da eşlenen işlemciler, ortak giden mesajları aralarında paylaşarak mesaj sayılarını düşürmektedir. Bu, özellikle de en fazla mesaj gönderen işlemcinin gönderdiği mesaj sayısını düşürmektedir. Çekirdek işlem olarak seyrek matris-vektör çarpımı kullanılmış ve testler 512 işlemcili bir sistemde yapılmıştır. Önerilen mesaj-paylaşma-temelli algoritma en fazla mesaj gönderen işlemcinin gönderdiği mesaj sayısında %84, sistemdeki toplam mesaj sayısında %60 düşüşe imkan tanımıştır.
Özet (Çeviri)
The performance of paralellized High Performance Computing (HPC) applications is tied to the efficiency of the underlying processor-to-processor communication. In latency-bound applications, the performance runs into bottleneck by the processor that is sending the maximum number of messages to the other processors. To reduce the latency overhead, we propose a two-phase message-sharing-based algorithm, where the bottleneck processor (the processor sending the maximum number of messages) is paired with another processor. In the first phase, the bottleneck processor is paired with the processor that has the maximum number of common outgoing messages. In the second phase, the bottleneck processor is paired with the processor that has the minimum number of outgoing messages. In both phases, the processor pair share the common outgoing messages between them, reducing their total number of outgoing messages, but especially the number of outgoing messages of the bottleneck processor. We use Sparse Matrix-Vector Multiplication as the kernel application and a 512-processor setting for the experiments. The proposed message-sharing algorithm achieves a reduction of 84% in the number of messages sent by the bottleneck processor and a reduction of 60% in the total number of messages in the system.
Benzer Tezler
- GPU üzerinde yazılım tabanlı anten gerçeklenmesi
Realization of software-defined antenna on GPU
ABDULLAH BAKIRTAŞ
Yüksek Lisans
Türkçe
2015
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. SELÇUK PAKER
- Energy aware endurance framework for mission critical aerial networks
Güdümlü havasal ağlar için enerji farkında endürans modeli
YUSUF ÖZÇEVİK
Doktora
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. BERK CANBERK
- Performance and computational analysis of polarization-adjusted convolutional (PAC) codes
Kutupsal ve polarizayson ayarlı evrişimli (PAC) kodlarının performans ve hesaplama analizi
MOHSEN MORADI
Doktora
İngilizce
2022
Elektrik ve Elektronik Mühendisliğiİhsan Doğramacı Bilkent ÜniversitesiElektrik ve Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. ERDAL ARIKAN
- A software defined network framework in 5G wireless systems
5G kablosuz sistemlerde yazılım temelli ağ iskeleti
GÖKHAN SEÇİNTİ
Doktora
İngilizce
2017
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. BERK CANBERK
- Performance improvement of the two dimensional broadcast-based distributed shared memory multiprocessor systems by message operations
İki boyutlu yayım tabanlı dağıtık ortak hafızalı mikroişlemci sistemlerinin performansının mesaj operasyonları ile artırılması
İPEK ABASIKELEŞ
Doktora
İngilizce
2013
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÇukurova ÜniversitesiElektrik ve Elektronik Mühendisliği Bölümü
YRD. DOÇ. DR. MEHMET FATİH AKAY