Geri Dön

Parallel implementation of the finite element method on graphics processors for the solution of incompressible flows

Grafik kartlarında paralel bir biçimde çalışacak sonlu elemanlar yöntemi tabanlı sıkıştırılamaz akış çözücü geliştirilmesi

  1. Tez No: 383082
  2. Yazar: MAHMUT MURAT GÖÇMEN
  3. Danışmanlar: YRD. DOÇ. DR. CÜNEYT SERT
  4. Tez Türü: Yüksek Lisans
  5. Konular: Makine Mühendisliği, Mechanical Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2014
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Makine Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 114

Özet

Son yıllarda grafik kartlarının (GPU) performanslarının ana işlemci (CPU) performanslarına göre çok daha hızlı artması ve bu kartların bilimsel hesaplama için kullanılmasını kolaylaştıran programlama araçlarının geliştirilmesi ile birlikte GPU'lar yüksek başarımlı bilimsel hesaplama ihtiyaçları için önemli bir alternatif olmuş ve popüler araştırma konuları arasına girmiştir. Akışkanlar mekaniği alanında çalışan araştırmacılar, paralelleştirme potansiyeli çok yüksek olan Lattice Boltzmann ve Sürekli Olmayan Galerkin gibi metotların GPU üzerinde programlanması ile CPU'larda çalışan kodlara göre 10'larca kata varan hız artışları elde edebilmişlerdir. Ancak sonlu hacim ve özellikle sonlu eleman metodu tabanlı akış çözücülerinin GPU üzerinde paralel çalıştırılması ile ilgili çalışmalar literatürde çok az sayıdadır. Bu proje çalışması Sonlu Eleman Metodu temelli bir akış çözücüsünün GPU üzerinde paralel çalışacak biçimde geliştirilmesini kapsamaktadır. GPU üzerinde paralel programlama için NVIDIA firmasının 2007 yılında geliştirdiği CUDA (Compute Unified Device Architecture) programlama aracı kullanılmış ve üç boyutlu, laminer, sıkıştırılamayan, ısı transferi içeren akışlar çalışılmıştır. Denklemlerin ayrıştırılmasında 2 farklı kademeli adım tekniği kullanılmıştır. Geliştirilen çözücünün doğruluğu mikro kanal akışı ve eşlenik ısı transferli boru akışı da dahil olmak üzere 5 farklı test problemiyle denenmiştir. Kademeli adım tekniğinin her bir aşamasının CPU ve GPU'da aldığı süreler detaylıca incelenmiştir. Karşılaştırmalı hız testleri 700 bin ile 6.7 milyon arasında bilinmeyen içeren ağlarda yapılmıştır. CPU'daki paralelleştirmeler Intel'in MKL kütüphanesi ve OpenMP ile GPU'daki paralelleştirmeler ise çoğunlukla CUBLAS, CUSPARSE ve CUSP kütüphaneleri gerektiğinde ise GPU üzerinde çalışacak kerneller yazılarak yapılmıştır. Denenen en büyük ağ için GPU, CPU'nun 1 izleği (thread) ve 8 izleği (8 threads) karşısında sırasıyla 5.79 kat ve 1.86 hızlı çalışmaktadır. Kayan noktalı sayıların tek hassasiyetli depolanması durumu özel olarak incelenmiş ve bu durumda çözüm doğruluğunda bir kötüleşme tespit edilmemekle birlikte, hem CPU'da hem GPU'da 2 kat hızlanma kaydedilmiştir. Açık (explicit) kademeli adım tekniği ile karşılaştırıldığında kapalı (implicit) yöntemin zamana bağlı olmayan problemleri daha hızlı çözdüğü görülmüş, buna karşın açık kademeli adım tekniğinin daha az hafıza kullandığı ortaya çıkmıştır.

Özet (Çeviri)

In recent years clock speeds and memory bandwidths of Graphics Processing Units (GPUs) increased dramatically compared to CPUs. Also GPU vendors developed and freely released new programming tools to make scientific computing on GPUs easier. With these recent developments the use of GPUs for general purpose computing becomes a popular research field. Researchers previously demonstrated that use of GPUs may provide tens of times of speeds-ups compared to CPU solvers for CFD methods such as Smoothed Particle Hydrodynamics, Lattice Boltzmann and Discontinuous Galerkin, which are known to offer very high parallelization potential. However, studies for the utilization of GPUs for classical finite volume and especially for finite element based CFD codes are rare in the literature. This study involves the development of a flow solver based on the Finite Element Method (FEM) working parallel on GPUs. CUDA (Compute Unified Device Architecture) programming toolkit developed by NVIDIA is used for GPU programming. Three-dimensional, laminar, incompressible, flows with possible heat transfer effects are considered. Governing equations are discretized using 2 different fractional step algorithms. Accuracy of the developed solver is tested using 5 benchmark problems, including a microchannel flow and flow inside a tube with conjugate heat transfer. Each step of the fractional step algorithm is investigated in detail on the CPU and GPU for run time performance. Speed-up tests are performed on a series of meshes with total number of unknowns between 700,000 and 6.7 million. Parallelization on the CPU is achieved by using Intel's MKL library and OpenMP and on the GPU mostly CUBLAS, CUSPARSE and CUSP libraries are used with some scratch-built GPU kernels whenever necessary. For the largest mesh tried, GPU usage resulted in 5.79 and 1.86 times speed-ups compared to single-thread and 8-thread CPU solutions, respectively. The use of single precision arithmetic is investigated from accuracy and efficient points of view and it is seen that it does not degrade accuracy, while providing almost 2 times speed-up both on the CPU and the GPU. Compared to the explicit version, implicit fractional step algorithm turned out to be advantageous in terms of run time for steady state problems. On the other hand, explicit method uses less memory as expected.

Benzer Tezler

  1. FPGA based hardware accelerator for euler equations with finite volume method

    Euler denklemleri için sonlu hacimler yöntemi ile FPGA tabanlı donanım hızlandırıcı

    EMİNE ELİF YİĞİT

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Savunma Teknolojileri Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ RAMAZAN YENİÇERİ

  2. İstanbul metrosu Kabataş Mecidiyeköy hattı km 1+500 – km2+100 arasında tünel kazılarına bağlı gelişen yüzeydeformasyonlarının değerlendirilmesi

    Assessment of surface settlements induced by tunneling between km 1+500 – km 2+100 of Kabataş – Mecidiyeköy line in İstanbul metro

    JAVIDAN ALAKBAROV

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    Jeoloji Mühendisliğiİstanbul Teknik Üniversitesi

    Jeoloji Mühendisliği Ana Bilim Dalı

    DOÇ. DR. YILMAZ MAHMUTOĞLU

  3. A parallel monolithic approach for the numerical simulation of fluid-structure interaction problems

    Akışkan-yapı etkileşimi problemlerinin sayısal simülasyonu için paralel monolitik bir yöntem

    ALİ EKEN

    Doktora

    İngilizce

    İngilizce

    2016

    Havacılık Mühendisliğiİstanbul Teknik Üniversitesi

    Uçak ve Uzay Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. HAYRİ ACAR

    DOÇ. DR. MEHMET ŞAHİN

  4. Approaches to the modeling of inelasticity and failure of rubberlike materials

    Başlık çevirisi yok

    HÜSNÜ DAL

    Doktora

    İngilizce

    İngilizce

    2012

    İnşaat MühendisliğiTechnische Universität Dresden

    Yapı Malzemesi Ana Bilim Dalı

    PROF. MICHAEL KALISKE

  5. Torna takımlarında mikro yüzey teksürü uygulamasının kesme kuvvetlerine etkisinin incelenmesi

    Investigation of micro surface texture application on turning tools on cutting forces

    EMRE AKI

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Makine Mühendisliğiİstanbul Teknik Üniversitesi

    Makine Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ CANAN GAMZE GÜLERYÜZ PARASIZ

    DR. ÖĞR. ÜYESİ ALİ TANER KUZU