Increasing data reuse in parallel sparse matrix-vector and matrix-transpose-vector multiply on shared-memory architectures
Paylaşılan bellek mimarisinde gerçekleştirilen paralel seyrek matris-vektör ve devrik-matris-vektör çarpımında veri yeniden kullanımını arttırmak
- Tez No: 374387
- Danışmanlar: PROF. DR. CEVDET AYKANAT
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2014
- Dil: İngilizce
- Üniversite: İhsan Doğramacı Bilkent Üniversitesi
- Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 58
Özet
Seyrek matris-vektör ve devrik-matris-vektör çarpımları (Seyrek AATx) yinelemeli çözücülerde kullanılan çekirdek işlemlerdir. Girdi matrisi A'nın ve devriğinin seyreklik deseni yinelemeler boyunca aynı kalmaktadır. Matrisin düzensiz seyreklik deseni nedeniyle, bu Seyrek AATx operasyonları sırasında CPU önbelleği tam anlamıyla kullanılamaz. Seyrek AATx operasyonu için iki paralelleştirme stratejisi öneriyoruz. Metotlarımız A matrisini bölümleyerek matris sıfır dışı girdileri ve vektör girdileri için önbellek yerelliği sağlamaktadır. Deneylerimizi çok çeşitli seyrek matrisler kullanarak piyasaya yeni sunulmuş Intel Xeon Phi yardımcı işlemci üzerinde yürüttük. Deneysel sonuçlar önerdiğimiz metotların literatürdeki en gelişmiş metotlardan daha yüksek performans geliştirmesi elde ettiğini göstermektedir.
Özet (Çeviri)
Sparse matrix-vector and matrix-transpose-vector multiplications (Sparse AATx) are the kernel operations used in iterative solvers. Sparsity pattern of the input matrix A, as well as its transpose, remains the same throughout the iterations. CPU cache could not be used properly during these Sparse AA T x operations due to irregular sparsity pattern of the matrix. We propose two parallelization strategies for Sparse AA T x. Our methods partition A matrix in order to exploit cache locality for matrix nonzeros and vector entries. We conduct experiments on the recently-released Intel Xeon Phi coprocessor involving large variety of sparsematrices. Experimental results show that proposed methods achieve higher performance improvement than the state-of-the-art methods in the literature.
Benzer Tezler
- Sağlık bilimlerinde araştırma verilerinin yönetimi: Hacettepe Üniversitesi lisansüstü öğrencilerinin farkındalıklarının değerlendirilmesi
Research data management in health sciences: assessment of Hacettepe University graduate students' awareness
EDA ÖZEL
Yüksek Lisans
Türkçe
2023
Bilgi ve Belge YönetimiHacettepe ÜniversitesiBilgi ve Belge Yönetimi Ana Bilim Dalı
PROF. DR. ÖZGÜR KÜLCÜ
- Tarihi kentlerde su sarnıçlarının yeniden kullanımı üzerine bir araştırma: Safranbolu örneği
A research about adaptive reuse of cisterns in historic cities: Case of Safranbolu
İREM KAHYAOĞLU
Yüksek Lisans
Türkçe
2023
MimarlıkÇankaya ÜniversitesiMimarlık Ana Bilim Dalı
DOÇ. DR. TİMUÇİN HARPUTLUGİL
- Trakya bölgesinde biyogaz potansiyelinin belirlenmesi
Determination of biogas potential in the region of thrace
ELİF CANTEKİN
Yüksek Lisans
Türkçe
2022
Çevre MühendisliğiTekirdağ Namık Kemal ÜniversitesiÇevre Mühendisliği Ana Bilim Dalı
DOÇ. DR. GÜL KAYKIOĞLU
- Energy efficiency of massive MIMO systems
Massive MIMO sistemlerinde enerji verimliliği
MOHAMMED SAADALLAH OBAIDI
Yüksek Lisans
İngilizce
2016
Elektrik ve Elektronik MühendisliğiYıldız Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
DOÇ. DR. TANSAL GÜÇLÜOĞLU
- Bazı sebzelerde atık sularla sulamanın kalite üzerine etkisi
The effect of the quality of irrigation with wastewater on some vegetables
OZAN ZAMBİ
Doktora
Türkçe
2022
ZiraatBursa Uludağ ÜniversitesiBahçe Bitkileri Ana Bilim Dalı
DOÇ. DR. NURAY AKBUDAK