Dynamic allocation of physical registers in simultaneous multi-threading processors for performance, power, fairness, and quality of service
Eş zamanlı çoklu işparçacıklı işlemcilerde performans, güç, adalet ve servis kalitesi için fiziksel yazmaçların dinamik ayrılması
- Tez No: 567674
- Danışmanlar: DOÇ. DR. GÜRHAN KÜÇÜK
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2019
- Dil: İngilizce
- Üniversite: Yeditepe Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 49
Özet
Günümüzde eşzamanlı çoklu işparçacıklı işlemcileri, birden fazla iş parçacığının çoklu veri yolu elemanlarını paylaşmasına izin verir. Bu şekilde veri paylaşımı, bir eşzamanlı çoklu iş parçacıklı işlemcisinin alan gereksimini mütevazı bir boyutta tutulabilir. Ancak, birden fazla iş parçacığı aynı kaynak için yarıştığında, bu tür bir kaynak paylaşımı, kaynak çatışmaları nedeniyle büyük bir problem olabilir. Daha önceki çalışmada, yazarlar performansı artırmak için belirli Fiziksel Yazmaç Dosyalarını (FYD) belirli iş parçacıklarına ayırarak, FYD'yi sınırlandırmayı önermektedirler. Ancak, tüm iş yükü kombinasyonları için sabit miktarda kaynak ayıran sabit tipte bir sınırlandırma mekanizması önermektedirler. Bu tezde, bu tür bir mekanizma ile optimum performansı elde edemiyeceğimizi gösteriyoruz çünkü iş parçacıklarının kaynak gereksinimleri kendi yürütme zamanlarının herhangi bir zamanında oldukça değişkendirler. İlk tasarımımızda, bu mekanizmayı geliştirmek için, dinamik olarak değişerek FYD'yi sınırlandıran bir mekanizma öneriyoruz. Bu tasarımda, genel performansı takip ediyoruz ve bir tepe tırmanma algoritması yardımıyla, FYD'nin sınırlarını optimal pozisyona ulaşana kadar değiştiriyoruz. Bu tasarımla birlikte ortalam olarak yüzde 8.5 performans artışı sağlıyoruz. En yüksek ulaştığımız performans artışımız yüzde 41'a ulaştı. İkinci tasarımımızda, her iş parçacığı için özel bir FYD öneriyoruz. Basitçe, ilk tasarımımıza kıyasla daha iyi güç/enerji rakamları elde etmek için her bir çalışan iş parçacığına farklı FYD atıyoruz. FYD'nin her bir iş parçacığı tarafından verimli kullanımını hesaplamak için Kaynak Girişi Başına Taahhüt Edilen Komutlar verimlilik ölçütünü kullanıyoruz.Bir iş parçacığı kendisine ait olan FYD'yi tam olarak kullanmadığında, verimlilik ölçüsü düşer ve böylece ihityaç duyulmayan belirli sayıda FYD'yi kapatabileceğimizi farkederiz.Sonuç olarak, FYD'yi kapatarak da güç tasarrufu sağlayabiliriz. Deneylerimiz, ilk tasarımımıza kıyasla neredeyse 4 kat daha fazla güç tasarrufu sağlayabildiğimizi gösteriyor.
Özet (Çeviri)
Today, Simultaneous Multi-Threading (SMT) processors allow sharing of multiple datapath elements by multiple threads. With this resource sharing, the area requirement of an SMT processor can be kept at a modest size. However, when multiple threads compete for the same resource, this kind of resource sharing can be a major problem due to resource conflicts. In an earlier study, authors propose to cap Physical Register Files (PRF) to improve performance by allocating certain PRF entries to specific threads. However, they propose a fixed-type capping mechanism which allocates a fixed amount of resource for all type of workload combinations. In this thesis, we show that optimum performance cannot be achieved by such a mechanism since resource requirements of threads can be quite variable at any time during their execution. In our first design, to improve the current state of the art, we propose a dynamically-changing PRF-capping mechanism. In this design, we track down the overall throughput and with the help of a hill climbing algorithm, we change the PRF cap size until it reaches to a near-optimal position. With this design, we achieve 8.5 percent performance improvement, on the average. Our peak performance improvement reaches to 41 percent. In our second design, we propose a dedicated PRF cap size for each thread. Simply, we assign different PRF cap size to each running thread to achieve better power/energy figures compared to our first design. We utilize Committed Instructions Per Resource Entry (CIPRE) efficiency metric to calculate the efficient-use of PRF by each thread. When a thread does not fully utilize its share on the PRF, its efficiency metric goes down and we realize that we can turn off a certain number of PRF entries which are not needed. As a result, by turning off PRF partitions we can also save power. Our experiments show that we can save almost 4 times more power compared to our first design.
Benzer Tezler
- Okunabilir kopyalama algoritmalı DSM sisteminin gerçeklenmesi
Başlık çevirisi yok
ÖZGÜR KORAY ŞAHİNGÖZ
Yüksek Lisans
Türkçe
1998
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiKontrol ve Bilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. TAKUHİ NADİA ERDOĞAN
- APPN mimarisi ile diğer şebeke mimarilerinin bütünleştirilmesine ilişkin yöntemler
Integration methods of APPN architecture and other networking architectures
ALPER GÜVENER
Yüksek Lisans
Türkçe
2000
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiPROF.DR. GÜNSEL DURUSOY
- Humanitarian assistance policies of the European Union towards syrian refugees in Turkey
Avrupa Birliği'nin Türkiye'deki Suriyeli mültecilere yönelik insani yardım politikaları
CANSU ÇELİKER
Yüksek Lisans
İngilizce
2018
Siyasal BilimlerOrta Doğu Teknik ÜniversitesiSiyaset Bilimi ve Kamu Yönetimi Ana Bilim Dalı
DOÇ. DR. BAŞAK KALE LACK
- İnşaat sektöründe işgücü özelliklerini belirlemeye yönelik bir çalışma
Başlık çevirisi yok
ZÜBEYDE YILDIRIM
- ComCoS: An enhanced cache partitioning technique for integrated modular avionics
ComCoS: Entegre modüler aviyonikler için gelişmiş bir önbellek bölümleme tekniği
YAKUP HÜNER
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiSavunma Teknolojileri Ana Bilim Dalı
DR. ÖĞR. ÜYESİ RAMAZAN YENİÇERİ