Geri Dön

Evaluating impacts of micro-architectural metrics on error resilience and performance of general purpose GPU applications

Mikro-mimari metriklerin genel amaçlı GPU uygulama hatalarına ve performansına etkilerinin değerlendirilmesi

  1. Tez No: 813983
  2. Yazar: BURAK TOPÇU
  3. Danışmanlar: DR. ÖĞR. ÜYESİ IŞIL ÖZ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: İngilizce
  9. Üniversite: İzmir Yüksek Teknoloji Enstitüsü
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 110

Özet

Hızla artan veri işleme görevleri güçlü ve enerji tüketimi açısından verimli heterojen hesaplama ortamları gerektirir ve GPU cihazları birçok görevi paralel şekilde çalıştırarak bu sistemlerdeki yoğun iş yüklerini hızlandırmada önemli bir misyon üstlenir. Artan mimari karmaşıklık ve GPU cihazlarının yaygın şekilde kullanılması güvenlik açısından önemli uygulamalar için hataya karşı dayanıklılığa ilişkin endişeler ortaya çıkarır. Yanı sıra, performansı artırırken enerji tüketimini azaltmayı hedefleyen yaklaşımlar ise hataya karşı dayanıklılığı yakınsamalar yapmak ve faydalanmak yönüyle konuyu ele alır. Hataya karşı dayanıklılığı, hata oluşumuna yönelimi veya çıktıyı çok bozmayacak yakınsamaları değerlendirmek bir programın cihazdaki çalışmasına yönelik kapsamlı bilgilere sahip olmayı gerekli kılar. Bu tezde, GPU'daki gerçek zamanlı çalışmayı mikro mimari ölçümler aracılığıyla sunan ve görselleştiren bir performans ve güç izleme aracı geliştirdik. Bu araç sayesinde, çalışma esnasındaki performans darboğazları ve meydana gelen hataların çıktı kalitesini nasıl etkilediği hakkında birçok temel anlayış elde ettik. Daha sonra, GPU uygulamaları için hata güvenlik açığını tahmin eden bir yapı öneriyoruz. Bu yapı, hata toleransını doğru bir şekilde tahmin etmeyi sağlar ve önemli çaba gerektiren hata oluşma olasılığını analiz etmekten kurtarır. İzleme aracıyla gözlemlenen performans darboğazları ve tahmin deneyleri sırasında elde edilen hata yayılımı gözlemlerini temel alarak, özellikle bellek kullanımından kaynaklı GPU programlarının performansını ve gücünü iyileştirmeyi hedefleyen donanım tabanlı bir yakınsama aracı sunuyoruz. Çalışma zamanında bellek kullanımına yönelik darboğazlarını çözen yakınsama yöntemi çıktıdaki doğruluğu %98'in üzerinde tutarken, performansı 1,49× (en fazla 2,1×) artırır ve enerji tüketimini %28,4 (%52,6'ya kadar) azaltır.

Özet (Çeviri)

Rapidly growing data processing tasks require powerful and energy-efficient heterogeneous computing systems, and GPUs take on a significant mission for those systems in accelerating heavy workloads by executing multiple parallel tasks concurrently. Increasing architectural complexity and widening employment of GPUs bring error resiliency concerns for safety-critical applications. Furthermore, approaches that enhance performance and reduce energy dissipation handle error resiliency on GPUs through approximate computing solutions. Evaluating error resiliency in terms of either identifying error proneness of a system or investigating approximations without much disturbing the output necessities robust knowledge about the execution of a program on a device. In this thesis, we develop a runtime performance and power monitoring tool visualizing the execution with detailed micro-architectural metrics. By utilizing the tool, we acquire several fundamental understandings about runtime performance bottlenecks and how perturbations affect output quality. Afterward, we propose a framework predicting fault vulnerability for error-resilient GPU applications. The framework can accurately estimate error tolerance and saves from analyzing the fault occurrence probability requiring significant effort. Depending on the performance bottlenecks observed with the tool and the error propagation gained during prediction experiments, we introduce a hardware-based approximation computing approach targeting to improve the performance and power of GPU programs, especially memory-bound ones. The approximation method, which resolves memory utilization bottlenecks at runtime, enhances performance by 1.49× (up to 2.1×) and diminishes energy consumption by 28.4% (up to 52.6%) while maintaining the accuracy on the output above 98%.

Benzer Tezler

  1. Ergenlerde (13-18 yaş) cinsel istismar sonrası immün sistem değişikliklerinin değerlendirilmesi

    The evaluation of the immüne system changes after sexual abuse in adolescents(13-18 year old)

    HAMZA AYAYDIN

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2012

    Allerji ve İmmünolojiİstanbul Üniversitesi

    Çocuk Ruh Sağlığı ve Hastalıkları Ana Bilim Dalı

    DOÇ. DR. OSMAN ABALI

  2. Arcti̇i̇n maddesi̇ni̇n deneysel peri̇odonti̇ti̇s modeli̇ üzeri̇ndeki̇ anti̇enflamatuvar etki̇nli̇ği̇ni̇n i̇ncelenmesi̇

    Evaluation of anti inflammatory effect of arctiin on experimental periodontitis model

    AHMET AYDOĞDU

    Doktora

    Türkçe

    Türkçe

    2014

    Diş HekimliğiOndokuz Mayıs Üniversitesi

    Periodontoloji Ana Bilim Dalı

    DOÇ. DR. ELİF ESER SAKALLIOĞLU

  3. Evliyâ Çelebi Seyahatnâmesi'nin grameri: Fiil

    The grammar of Evliya Çelebi's Seyahatnâme: Verb

    ERKAN HİRİK

    Doktora

    Türkçe

    Türkçe

    2014

    Türk Dili ve EdebiyatıKırıkkale Üniversitesi

    Türk Dili ve Edebiyatı Ana Bilim Dalı

    DOÇ. DR. AHMET KARADOĞAN

  4. A web based multi-criteria decision support system for department selection process of vocational high school students

    Meslek lisesi öğrencilerinin bölüm seçim süreci için web tabanli çok kriterli karar destek sistemi

    MUSTAFA COŞKUN

    Yüksek Lisans

    İngilizce

    İngilizce

    2013

    Bilgi ve Belge YönetimiBoğaziçi Üniversitesi

    Yönetim Bilişim Sistemleri Ana Bilim Dalı

    PROF. DR. MELTEM SEBA ÖZTURAN

  5. Çalışanların iç ve dış kontrol odaklarının duygusal zekayla ilişkisi: Kamuda bir alan araştırması.

    A research about a relation between interior and exterior locus of control and the emotional intelligence which the workers in an organisation

    ZAFER OKTAY

    Yüksek Lisans

    Türkçe

    Türkçe

    2013

    İşletmeGaziosmanpaşa Üniversitesi

    Yönetim ve Organizasyon Ana Bilim Dalı

    YRD. DOÇ. DR. KUBİLAY ÖZYER