Geri Dön

Cha and core discovery on intel chips and generating optimized thread binding

Cha ve çekirdek topolojisiyle uyumlu iş parçacığı haritalaması

  1. Tez No: 851090
  2. Yazar: AYDIN ÖZCAN
  3. Danışmanlar: DOÇ. DR. DİDEM UNAT ERTEN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: İngilizce
  9. Üniversite: Koç Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 56

Özet

Dağıtık dizin temelli önbellek tutarlılığına sahip modern çok çekirdekli bilgisayar mimarilerinde her bir bellek adresi, ona atanmış olan bir dağıtık dizin birimi tarafından yönetilir. Bu birime Önbellekleme/Merkez Aracısı (ÖMA) ismi verilir ve birim, önbellek satırını gözlemler. ÖMA ve çekirdeklerin fiziksel konumları programcılar tarafından bilinmez. Bu çalışmada öncelikle, Intel Xeon işlemciler için ÖMA ve çekirdeklerin konumlarını açığa çıkaran farklı yöntemlerin analizi ve kıyaslaması yapılmıştır. Bununla birlikte bellek adreslerinin ÖMA birimlerine haritalamasını yapan yöntemlerin de analiz ve kıyaslaması yapılmıştır. Topoloji ve adres haritalaması bilgisi kullanılarak, birbiriyle haberleşen çekirdekler ve ÖMA'ların arasındaki fiziksel mesafenin uygulama performansı üzerindeki etkileri üzerine araştırma yapılmıştır. Bu araştırmadan yola çıkarak önbellek tutarlılığını sağlayan trafiği azaltmayı hedefleyen ve iş parçacıklarının çekirdeklere atanmasıyla görevli bir iş parçacığı haritalama algoritması geliştirilmiştir. Geliştirdiğimiz algoritmanın, iş parçacıkları arasında paylaşımlı yazılabilir bilginin yüksek oranda mevcut olduğu uygulamalarda performansı geliştirmesini bekliyoruz. Bu algoritma, yüksek oranda yonga trafiğine sebep olan uygulamalar üzerinde test edilmiştir. Ardışık iş parçacığı haritalamasına kıyasla Seyrek matris-vektör çarpımında %5.6'ya, Barnes'ta %8'e, sıvı akışkanlığı simülasyon uygulamasında %25'e, LU ayrıştırmasında %6'ya varan hızlanmalar sağladığı gözlemlenmiştir.

Özet (Çeviri)

In modern multi-core architectures with distributed directory-based cache coherence, each memory address is overseen by a distributed directory unit, known as a Caching/Home Agent (CHA), that monitors cache line state and location. Neither the CHA nor core locations in a processor are directly exposed to the programmer. In this work, we firstly analyze and compare the methodologies for uncovering both the CHA and core topology of Intel Xeon Scalable processors, as well as the methods to reveal the mapping of memory addresses to CHAs. Leveraging the topology and the address mapping information, we investigate the impact of spatial proximity between communicating cores and CHAs on application performance, and propose a thread mapping heuristic that assigns threads to cores by considering cache coherence traffic. We expect our heuristic to achieve significant performance gains on applications with high amount of on-chip cache coherence traffic due to high percentage of shared written data. We evaluated our heuristic on applications that exhibit high amount of on-chip communication traffic. The heuristic achieves up to 5.6% speedup over compact placement on merge-based SpMV application, up to 8% with an average of around 4.4% on Barnes application, around 25% for Fluidanimate application to simulate 60 frame per second, and lastly approximately 6% for LU across different matrices. We also prove the improved performance is in fact related to reduced on-chip traffic on the mesh.

Benzer Tezler

  1. Dondurulmuş hamur tekniği kullanılarak üretilen beyaz tava ekmeği ve hamburger ekmeğinde maya performansı ve ekmek özellikleri

    Başlık çevirisi yok

    AHMET FAİK KOCA

    Doktora

    Türkçe

    Türkçe

    1989

    Gıda MühendisliğiAtatürk Üniversitesi

    Tarım Ürünleri Teknolojisi Ana Bilim Dalı

    DOÇ. DR. ZEKİ ERTUGAY

  2. Hıp ve non-hıp zirkonya bloklardan cad-cam yöntemi ile üretilen kuron kopinglerinin marjinal uyumlarının karşılaştırılması

    Marginal fit comparison of hip and non-hip zirconia copings with 3 different marginal finish lines fabricated with two different cad-cam systems

    CUMHUR KORKMAZ

    Doktora

    Türkçe

    Türkçe

    2011

    Diş HekimliğiGATA

    Protetik Diş Tedavisi Ana Bilim Dalı

    DOÇ. DR. O. CUMHUR SİPAHİ

  3. Doğrultucularda ve transformatörlerde harmonikler ve sıradışı harmoniklerin incelenmesi

    Examination of harmonics and uncharacteristic harmonics in converters and transformers

    ÇETİN METİN YILMAZ

    Yüksek Lisans

    Türkçe

    Türkçe

    1992

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    PROF. DR. R. NEJAT TUNÇAY

  4. Development and characterization of (carbonated) hydroxyapatite, akermanite involving polycaprolactone scaffolds

    Polikaprolakton iskeleleri içeren (karbonatlı) hidroksiapatitin, akermanitin geliştirilmesi ve karakterizasyonu

    GERÇEM ALTUNORDU

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    BiyoteknolojiOrta Doğu Teknik Üniversitesi

    Biyomedikal Mühendisliği Ana Bilim Dalı

    PROF. DR. DİLEK KESKİN

    PROF. DR. ZAFER EVİS

  5. Evrişimsel sinir ağı kullanarak kan parametrelerinden COVID-19 tespiti

    Diagnosis of COVID-19 from blood parameters using convolutional neural network

    GİZEMNUR EROL DOĞAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKonya Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ BETÜL UZBAŞ