Characterizing performance variations of hpc systems through monitoring and unsupervised learning
Başlık çevirisi mevcut değil.
- Tez No: 798519
- Danışmanlar: Belirtilmemiş.
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Bilim ve Teknoloji, Computer Engineering and Computer Science and Control, Science and Technology
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2019
- Dil: İngilizce
- Üniversite: Technische Universität München
- Enstitü: Yurtdışı Enstitü
- Ana Bilim Dalı: Belirtilmemiş.
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 61
Özet
Özet yok.
Özet (Çeviri)
With the growing size of High-Performance Computing (HPC) installations, concerns on system stability and reliability are rising. Due to soft- and hardware-related failures, as well as manufacturing variability, system resource utilization may fall short of expectations, potentially leading to increased costs and complicating the deployment of envisioned exascale systems. Reliable detection of the component variances and failures has paramount importance in driving resource management decisions and mitigation strategies. However, the velocity and volume of fine-grained monitoring data makes traditionally applied, manual analytic techniques impractical, requiring automatized algorithms that can scale up to thousands of data points per second. The research presented in this work proposes an unsupervised variance detection framework capable of characterizing the performance variances of system components and detecting anomalies using performance and sensor monitoring data. Following an initial phase of data transformation and cleaning, the framework uses Bayesian Gaussian Mixture models to perform clustering of the available dataset. Its capabilities are demonstrated with an exploratory analysis on system monitoring data collected from an Intel Knights Landing-based cluster using the Leibniz Supercomputing Centre's Data Center Data Base monitoring system. The flexibility of the proposed variance detection framework is depicted through a set of case studies that focus on different levels of the targeted system architecture.
Benzer Tezler
- Akarsu havzası sistemlerinin planlanması için genel maksatlı bir simülasyon modeli
A General-purpose simulation model for planning of river basın systems
DEMİRAY ŞİMŞEK
- A Study on optimal control and on-lin observation of gas pipelines
Gaz boru hatlarının eniyi denetimi ve gerçek zamanlı gözlemlenmesi üzerine bir çalışma
İSMAİL DURGUT
Doktora
İngilizce
1998
Petrol ve Doğal Gaz MühendisliğiOrta Doğu Teknik ÜniversitesiPetrol ve Doğal Gaz Mühendisliği Ana Bilim Dalı
PROF. DR. TANSU MEHMETOĞLU
- Shape, size and functionalization dependent raman characterization of graphene quantum dots by DFT method
Grafen kuantum noktalarının YFT yöntemi ile şekil, boyut ve fonksiyonel gruba bağlı raman karakterizasyonu
ENES BERKAY GÖNEN
Yüksek Lisans
İngilizce
2024
Kimyaİstanbul Teknik ÜniversitesiKimya Ana Bilim Dalı
PROF. DR. MİNE YURTSEVER
- Yatay ön araştırma delgi verileri ile kayacın jeomekanik özelliklerinin ilişkilendirilmesi melen boğaz geçiş tüneli örneği
Correlation of geomechanical properties of rock with horizontal pre-drilling data Melen Bosphorus crossing tunnel example
AYDIN BAKIR
Doktora
Türkçe
2024
Jeoloji Mühendisliğiİstanbul Teknik ÜniversitesiJeoloji Mühendisliği Ana Bilim Dalı
PROF. DR. ENVER VURAL YAVUZ
- Green and digital transformation towards circular economy in the construction industry: Upcycling of construction and demolition wastes from diverse sources and their integration into 3D printing technology
İnşaat endüstrisinde döngüsel ekonomiye doğru yeşil ve dijital dönüşüm: Farklı kaynaklardan elde edilen inşaat yıkıntı atıklarının ileri dönüştürülmesi ve 3D baskı teknolojisine entegrasyonu
ANIL KUL
Doktora
İngilizce
2024
İnşaat MühendisliğiHacettepe Üniversitesiİnşaat Mühendisliği Ana Bilim Dalı
DOÇ. DR. GÜRKAN YILDIRIM