CNN-based server state monitoring and fault diagnosis using infrared thermography
Kızılötesi termografi kullanarak CNN tabanlı sunucu durumu izleme ve arıza teşhisi
- Tez No: 714446
- Danışmanlar: DR. ÖĞR. ÜYESİ HAMZA SALİH ERDEN, PROF. DR. BEHÇET UĞUR TÖREYİN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: İngilizce
- Üniversite: İstanbul Teknik Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Bilgisayar Bilimleri Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 75
Özet
Son yıllarda veri merkezleri (VM), bankacılık, sağlık, bilgi ve iletişim teknolojisi endüstrileri gibi dünyanın kritik ve önde gelen bazı kurumlarının bel kemiği haline gelecek şekilde hızla gelişti. Bu üstel büyüme, internet kullanıcılarının sayısındaki çarpıcı artış ve büyük veri, yapay zeka, nesnelerin interneti vb. gibi çeşitli bulut tabanlı uygulamalara yönelik yüksek talep tarafından tetiklenmiştir. Sonuç olarak, VM sayısında ve VM elektrik tüketim miktarlarında eş zamanlı bir artış olmuştur. Bu artış VM tesislerindeki ısı yönetimi, sistem güvenilirliğinin sürdürülmesi ve sunucu arızalarının azaltılması gibi yeni karmaşık zorlukları beraberinde getirmiştir. Bu üstesinden gelmek için literatürde hesaplamalı akışkanlar dinamiği (HAD) modelleri önerilmiştir. HAD hesaplama açısından pahalı olsalar da, VM ısıl dinamiklerini ve sıcaklık dağılımlarını doğru bir şekilde tanımlama yeteneğine sahiptir. Devasa veri ve hesaplama gücünün mevcudiyeti, umut verici bir yöntem olarak makine öğrenimi (ML) veri odaklı yaklaşımını ortaya çıkardı. Veriye dayalı teknikler, sistemin fiziksel davranışı hakkında açık bilgi olmadan sistem arasındaki verilerdeki karmaşık kalıpları ve ilişkileri bulma yeteneğine sahiptir. Ancak performansları, veri türü, özellik çıkarma yöntemleri ve algoritma seçimi gibi çeşitli faktörlerle sınırlıdır. CFD modellerini veriye dayalı modellerle entegre eden hibrit bir yaklaşım, çekici bir alternatif çözüm sunar. Bununla birlikte, hem CFD hem de ML veriye dayalı yöntemlerinin dezavantajlarından muzdariptir. Bu çalışmada, literatürde ilk kez, sunucu yüzeyi kızılotesi termografi (IRT) görüntülerine uygulanan en güncel yedi derin ön eğitimli evrişimsel sinir ağı (CNN) tabanlı mimari ve iki sığ CNN tabanlı mimariyi beş sunucu çalışma koşulunun otomatik teşhisi için değerlendiriyoruz. Bu koşullar, kısmi işlemci (CPU) yükü, maksimum CPU yükü, ana fan arızası, CPU fan arızası ve sunucu girişi tıkanıklığını içerir. Yaklaşımımız, iki ana aşamayı içeren transfer öğrenme kavramına dayanan denetimli bir öğrenme yaklaşımıdır. İlk olarak, daha düşük seviyeli özellikleri çıkarmak için büyük ImageNet veri kümesi üzerinde önceden eğitilmiş bir CNN modeli sınıflandırıcısı kullanılır. İkinci olarak, IRT görüntüleri, CNN model sınıflandırıcının daha yüksek seviyelerine ince ayar yapmak için kullanılır. Beş adet veri bölme oranı için sığ ve derin model mimarilerinin etkinliğini ve genelleştirilmesini değerlendirmek için katmanlı beş katlı çapraz doğrulama yeniden örnekleme yöntemi kullanılır. Sonuçlar, CNN mimarilerinin birden fazla bölme oranında çoğunluğu yüzde 98'in üzerinde yüksek tahmin performans doğrulukları elde ettiğini göstermektedir. Bu sonuçlar el yordamı özellikleriyle eğitilen geleneksel destek vektör makinesi sınıflandırıcılarının sonuçlarına göre oldukça yüksektir. CNN tabanlı algoritmaların etkinliği ve sağlamlığı, VM operatörlerine sunucuların ısıl yönetimini, enerji verimliliğini ve sistem güvenilirliğini iyileştirmek için alternatif bir yaklaşım sağlayabilir.
Özet (Çeviri)
Over the last few decades, data centers (DCs) have rapidly evolved to become the backbone of some of the world's most critical and prominent institutions such as banking, health, information and communication technology (ICT) industries. This exponential growth is triggered by the dramatic increase in the number of internet users and the high demand for diverse cloud-based applications such as Big Data, artificial intelligence (AI), internet of things (IoT), etc. As a consequence, there has been a simultaneous rise in the number of DCs and the amount of electricity consumption of DCs. This increase introduced new complex challenges in the DC facility such as thermal management, system reliability sustenance and server failure minimalization. To tackle these challenges, computational fluid dynamic (CFD) models have been proposed in the literature. The CFD models are capable of accurately describing the DC thermal dynamics and temperature distributions although they are computationally expensive. The availability of huge data and computational power has introduced machine learning (ML) data-driven approach as a promising method. Data-driven techniques have the ability to find complex patterns and relationships in data between system parameters without explicit knowledge of the physical behaviour of the system. However, their performance is limited by several factors including the type of data, feature extraction methods, and choice of algorithm. A hybrid approach that integrates CFD models with data-driven models provides an attractive alternative solution. However, it suffers from the drawbacks of both CFD and ML data-driven methods. In this study, we evaluate for the first time in the literature, seven state-of-the-art deep pretrained convolutional neural network (CNN)-based architectures and two shallow CNN-based architectures applied on server surface infrared thermography (IRT) images for the automatic diagnosis of five server operation conditions. These conditions include partial processor (CPU) load, maximum CPU load, main fan failure, CPU fan failure, and server entrance blockage. Our approach is a supervised learning approach based on the concept of transfer learning which involves two main stages. First, a CNN model classifier pretrained on the large ImageNet dataset is used to extract lower level features. Second, the IRT images are used to fine-tune the higher levels of the CNN model classifier. A stratified five-fold cross-validation resampling method is used to evaluate the effectiveness and generalization of the shallow and deep model architectures for five data sample split ratios. Results suggest that the CNN architectures achieve high prediction performance accuracies, with the majority having above 98% test accuracies across multiple split ratios. These results are significantly higher than those obtained using a traditional support vector machine classifier trained on handcrafted features. The effectiveness and robustness of the CNN-based algorithms can provide DC operators with an alternative approach to improve thermal management, energy efficiency, and system reliability of servers in DCs.
Benzer Tezler
- A metric learning based system for retail product recognition and novel class discovery
Metrik öğrenme tabanlı ürün tanıma ve yeni ürün keşfetme sistemi
İBRAHİM ŞAMİL YALÇINER
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. HAZIM KEMAL EKENEL
- Güvenlik kameralarındaki yüz görüntülerinin süper çözünürlüklenetleştirilmesi
Face enhancement in surveillance systems using super-resolutiontechniques
ALİ HÜSAMEDDİN ATEŞ
Yüksek Lisans
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ HÜSEYİN ESKİ
- Deep learning methods for blind super resolution using self-attention transformers and degradation estimations
Öz-dikkat dönüştürücüler ve bozulma tahminleri kullanarak kör süper çözünürlük için derin öğrenme yöntemleri
BATUHAN VARDAR
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. ŞEYDA ERTEKİN BOLELLİ
- Machine state detection by CNN on a low power microcontroller
Düşük güçlü mikro denetliyicide evrişimsel sinir ağları kullanarak makine durum tespiti
DORUK ERDEMGİL
Yüksek Lisans
İngilizce
2024
Elektrik ve Elektronik MühendisliğiYaşar ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. MUSTAFA GÜNDÜZALP
- Interpreting convolutional blocks as feature embedding by template matching for image recognition
Görüntü tanıma için evrişimsel blokların şablon eşleme yöntemiyle özellik gömme olarak yorumlanması
ADA GÖRGÜN
Yüksek Lisans
İngilizce
2023
Elektrik ve Elektronik MühendisliğiOrta Doğu Teknik ÜniversitesiElektrik ve Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. ABDULLAH AYDIN ALATAN