Geri Dön

Dynamic allocation of physical registers in simultaneous multi-threading processors for performance, power, fairness, and quality of service

Eş zamanlı çoklu işparçacıklı işlemcilerde performans, güç, adalet ve servis kalitesi için fiziksel yazmaçların dinamik ayrılması

  1. Tez No: 567674
  2. Yazar: HASANCAN GÜNGÖRER
  3. Danışmanlar: DOÇ. DR. GÜRHAN KÜÇÜK
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2019
  8. Dil: İngilizce
  9. Üniversite: Yeditepe Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 49

Özet

Günümüzde eşzamanlı çoklu işparçacıklı işlemcileri, birden fazla iş parçacığının çoklu veri yolu elemanlarını paylaşmasına izin verir. Bu şekilde veri paylaşımı, bir eşzamanlı çoklu iş parçacıklı işlemcisinin alan gereksimini mütevazı bir boyutta tutulabilir. Ancak, birden fazla iş parçacığı aynı kaynak için yarıştığında, bu tür bir kaynak paylaşımı, kaynak çatışmaları nedeniyle büyük bir problem olabilir. Daha önceki çalışmada, yazarlar performansı artırmak için belirli Fiziksel Yazmaç Dosyalarını (FYD) belirli iş parçacıklarına ayırarak, FYD'yi sınırlandırmayı önermektedirler. Ancak, tüm iş yükü kombinasyonları için sabit miktarda kaynak ayıran sabit tipte bir sınırlandırma mekanizması önermektedirler. Bu tezde, bu tür bir mekanizma ile optimum performansı elde edemiyeceğimizi gösteriyoruz çünkü iş parçacıklarının kaynak gereksinimleri kendi yürütme zamanlarının herhangi bir zamanında oldukça değişkendirler. İlk tasarımımızda, bu mekanizmayı geliştirmek için, dinamik olarak değişerek FYD'yi sınırlandıran bir mekanizma öneriyoruz. Bu tasarımda, genel performansı takip ediyoruz ve bir tepe tırmanma algoritması yardımıyla, FYD'nin sınırlarını optimal pozisyona ulaşana kadar değiştiriyoruz. Bu tasarımla birlikte ortalam olarak yüzde 8.5 performans artışı sağlıyoruz. En yüksek ulaştığımız performans artışımız yüzde 41'a ulaştı. İkinci tasarımımızda, her iş parçacığı için özel bir FYD öneriyoruz. Basitçe, ilk tasarımımıza kıyasla daha iyi güç/enerji rakamları elde etmek için her bir çalışan iş parçacığına farklı FYD atıyoruz. FYD'nin her bir iş parçacığı tarafından verimli kullanımını hesaplamak için Kaynak Girişi Başına Taahhüt Edilen Komutlar verimlilik ölçütünü kullanıyoruz.Bir iş parçacığı kendisine ait olan FYD'yi tam olarak kullanmadığında, verimlilik ölçüsü düşer ve böylece ihityaç duyulmayan belirli sayıda FYD'yi kapatabileceğimizi farkederiz.Sonuç olarak, FYD'yi kapatarak da güç tasarrufu sağlayabiliriz. Deneylerimiz, ilk tasarımımıza kıyasla neredeyse 4 kat daha fazla güç tasarrufu sağlayabildiğimizi gösteriyor.

Özet (Çeviri)

Today, Simultaneous Multi-Threading (SMT) processors allow sharing of multiple datapath elements by multiple threads. With this resource sharing, the area requirement of an SMT processor can be kept at a modest size. However, when multiple threads compete for the same resource, this kind of resource sharing can be a major problem due to resource conflicts. In an earlier study, authors propose to cap Physical Register Files (PRF) to improve performance by allocating certain PRF entries to specific threads. However, they propose a fixed-type capping mechanism which allocates a fixed amount of resource for all type of workload combinations. In this thesis, we show that optimum performance cannot be achieved by such a mechanism since resource requirements of threads can be quite variable at any time during their execution. In our first design, to improve the current state of the art, we propose a dynamically-changing PRF-capping mechanism. In this design, we track down the overall throughput and with the help of a hill climbing algorithm, we change the PRF cap size until it reaches to a near-optimal position. With this design, we achieve 8.5 percent performance improvement, on the average. Our peak performance improvement reaches to 41 percent. In our second design, we propose a dedicated PRF cap size for each thread. Simply, we assign different PRF cap size to each running thread to achieve better power/energy figures compared to our first design. We utilize Committed Instructions Per Resource Entry (CIPRE) efficiency metric to calculate the efficient-use of PRF by each thread. When a thread does not fully utilize its share on the PRF, its efficiency metric goes down and we realize that we can turn off a certain number of PRF entries which are not needed. As a result, by turning off PRF partitions we can also save power. Our experiments show that we can save almost 4 times more power compared to our first design.

Benzer Tezler

  1. Okunabilir kopyalama algoritmalı DSM sisteminin gerçeklenmesi

    Başlık çevirisi yok

    ÖZGÜR KORAY ŞAHİNGÖZ

    Yüksek Lisans

    Türkçe

    Türkçe

    1998

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Kontrol ve Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. TAKUHİ NADİA ERDOĞAN

  2. APPN mimarisi ile diğer şebeke mimarilerinin bütünleştirilmesine ilişkin yöntemler

    Integration methods of APPN architecture and other networking architectures

    ALPER GÜVENER

    Yüksek Lisans

    Türkçe

    Türkçe

    2000

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    PROF.DR. GÜNSEL DURUSOY

  3. Humanitarian assistance policies of the European Union towards syrian refugees in Turkey

    Avrupa Birliği'nin Türkiye'deki Suriyeli mültecilere yönelik insani yardım politikaları

    CANSU ÇELİKER

    Yüksek Lisans

    İngilizce

    İngilizce

    2018

    Siyasal BilimlerOrta Doğu Teknik Üniversitesi

    Siyaset Bilimi ve Kamu Yönetimi Ana Bilim Dalı

    DOÇ. DR. BAŞAK KALE LACK

  4. İnşaat sektöründe işgücü özelliklerini belirlemeye yönelik bir çalışma

    Başlık çevirisi yok

    ZÜBEYDE YILDIRIM

    Yüksek Lisans

    Türkçe

    Türkçe

    1996

    Mimarlıkİstanbul Teknik Üniversitesi

    PROF.DR. A. ŞULE ÖZÜEKREN

  5. ComCoS: An enhanced cache partitioning technique for integrated modular avionics

    ComCoS: Entegre modüler aviyonikler için gelişmiş bir önbellek bölümleme tekniği

    YAKUP HÜNER

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Savunma Teknolojileri Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ RAMAZAN YENİÇERİ