Cha and core discovery on intel chips and generating optimized thread binding
Cha ve çekirdek topolojisiyle uyumlu iş parçacığı haritalaması
- Tez No: 851090
- Danışmanlar: DOÇ. DR. DİDEM UNAT ERTEN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: İngilizce
- Üniversite: Koç Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 56
Özet
Dağıtık dizin temelli önbellek tutarlılığına sahip modern çok çekirdekli bilgisayar mimarilerinde her bir bellek adresi, ona atanmış olan bir dağıtık dizin birimi tarafından yönetilir. Bu birime Önbellekleme/Merkez Aracısı (ÖMA) ismi verilir ve birim, önbellek satırını gözlemler. ÖMA ve çekirdeklerin fiziksel konumları programcılar tarafından bilinmez. Bu çalışmada öncelikle, Intel Xeon işlemciler için ÖMA ve çekirdeklerin konumlarını açığa çıkaran farklı yöntemlerin analizi ve kıyaslaması yapılmıştır. Bununla birlikte bellek adreslerinin ÖMA birimlerine haritalamasını yapan yöntemlerin de analiz ve kıyaslaması yapılmıştır. Topoloji ve adres haritalaması bilgisi kullanılarak, birbiriyle haberleşen çekirdekler ve ÖMA'ların arasındaki fiziksel mesafenin uygulama performansı üzerindeki etkileri üzerine araştırma yapılmıştır. Bu araştırmadan yola çıkarak önbellek tutarlılığını sağlayan trafiği azaltmayı hedefleyen ve iş parçacıklarının çekirdeklere atanmasıyla görevli bir iş parçacığı haritalama algoritması geliştirilmiştir. Geliştirdiğimiz algoritmanın, iş parçacıkları arasında paylaşımlı yazılabilir bilginin yüksek oranda mevcut olduğu uygulamalarda performansı geliştirmesini bekliyoruz. Bu algoritma, yüksek oranda yonga trafiğine sebep olan uygulamalar üzerinde test edilmiştir. Ardışık iş parçacığı haritalamasına kıyasla Seyrek matris-vektör çarpımında %5.6'ya, Barnes'ta %8'e, sıvı akışkanlığı simülasyon uygulamasında %25'e, LU ayrıştırmasında %6'ya varan hızlanmalar sağladığı gözlemlenmiştir.
Özet (Çeviri)
In modern multi-core architectures with distributed directory-based cache coherence, each memory address is overseen by a distributed directory unit, known as a Caching/Home Agent (CHA), that monitors cache line state and location. Neither the CHA nor core locations in a processor are directly exposed to the programmer. In this work, we firstly analyze and compare the methodologies for uncovering both the CHA and core topology of Intel Xeon Scalable processors, as well as the methods to reveal the mapping of memory addresses to CHAs. Leveraging the topology and the address mapping information, we investigate the impact of spatial proximity between communicating cores and CHAs on application performance, and propose a thread mapping heuristic that assigns threads to cores by considering cache coherence traffic. We expect our heuristic to achieve significant performance gains on applications with high amount of on-chip cache coherence traffic due to high percentage of shared written data. We evaluated our heuristic on applications that exhibit high amount of on-chip communication traffic. The heuristic achieves up to 5.6% speedup over compact placement on merge-based SpMV application, up to 8% with an average of around 4.4% on Barnes application, around 25% for Fluidanimate application to simulate 60 frame per second, and lastly approximately 6% for LU across different matrices. We also prove the improved performance is in fact related to reduced on-chip traffic on the mesh.
Benzer Tezler
- Dondurulmuş hamur tekniği kullanılarak üretilen beyaz tava ekmeği ve hamburger ekmeğinde maya performansı ve ekmek özellikleri
Başlık çevirisi yok
AHMET FAİK KOCA
Doktora
Türkçe
1989
Gıda MühendisliğiAtatürk ÜniversitesiTarım Ürünleri Teknolojisi Ana Bilim Dalı
DOÇ. DR. ZEKİ ERTUGAY
- Hıp ve non-hıp zirkonya bloklardan cad-cam yöntemi ile üretilen kuron kopinglerinin marjinal uyumlarının karşılaştırılması
Marginal fit comparison of hip and non-hip zirconia copings with 3 different marginal finish lines fabricated with two different cad-cam systems
CUMHUR KORKMAZ
- Doğrultucularda ve transformatörlerde harmonikler ve sıradışı harmoniklerin incelenmesi
Examination of harmonics and uncharacteristic harmonics in converters and transformers
ÇETİN METİN YILMAZ
Yüksek Lisans
Türkçe
1992
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiPROF. DR. R. NEJAT TUNÇAY
- Development and characterization of (carbonated) hydroxyapatite, akermanite involving polycaprolactone scaffolds
Polikaprolakton iskeleleri içeren (karbonatlı) hidroksiapatitin, akermanitin geliştirilmesi ve karakterizasyonu
GERÇEM ALTUNORDU
Yüksek Lisans
İngilizce
2019
BiyoteknolojiOrta Doğu Teknik ÜniversitesiBiyomedikal Mühendisliği Ana Bilim Dalı
PROF. DR. DİLEK KESKİN
PROF. DR. ZAFER EVİS
- Evrişimsel sinir ağı kullanarak kan parametrelerinden COVID-19 tespiti
Diagnosis of COVID-19 from blood parameters using convolutional neural network
GİZEMNUR EROL DOĞAN
Yüksek Lisans
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKonya Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ BETÜL UZBAŞ