Parallel implementation of the finite element method on graphics processors for the solution of incompressible flows
Grafik kartlarında paralel bir biçimde çalışacak sonlu elemanlar yöntemi tabanlı sıkıştırılamaz akış çözücü geliştirilmesi
- Tez No: 383082
- Danışmanlar: YRD. DOÇ. DR. CÜNEYT SERT
- Tez Türü: Yüksek Lisans
- Konular: Makine Mühendisliği, Mechanical Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2014
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Makine Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 114
Özet
Son yıllarda grafik kartlarının (GPU) performanslarının ana işlemci (CPU) performanslarına göre çok daha hızlı artması ve bu kartların bilimsel hesaplama için kullanılmasını kolaylaştıran programlama araçlarının geliştirilmesi ile birlikte GPU'lar yüksek başarımlı bilimsel hesaplama ihtiyaçları için önemli bir alternatif olmuş ve popüler araştırma konuları arasına girmiştir. Akışkanlar mekaniği alanında çalışan araştırmacılar, paralelleştirme potansiyeli çok yüksek olan Lattice Boltzmann ve Sürekli Olmayan Galerkin gibi metotların GPU üzerinde programlanması ile CPU'larda çalışan kodlara göre 10'larca kata varan hız artışları elde edebilmişlerdir. Ancak sonlu hacim ve özellikle sonlu eleman metodu tabanlı akış çözücülerinin GPU üzerinde paralel çalıştırılması ile ilgili çalışmalar literatürde çok az sayıdadır. Bu proje çalışması Sonlu Eleman Metodu temelli bir akış çözücüsünün GPU üzerinde paralel çalışacak biçimde geliştirilmesini kapsamaktadır. GPU üzerinde paralel programlama için NVIDIA firmasının 2007 yılında geliştirdiği CUDA (Compute Unified Device Architecture) programlama aracı kullanılmış ve üç boyutlu, laminer, sıkıştırılamayan, ısı transferi içeren akışlar çalışılmıştır. Denklemlerin ayrıştırılmasında 2 farklı kademeli adım tekniği kullanılmıştır. Geliştirilen çözücünün doğruluğu mikro kanal akışı ve eşlenik ısı transferli boru akışı da dahil olmak üzere 5 farklı test problemiyle denenmiştir. Kademeli adım tekniğinin her bir aşamasının CPU ve GPU'da aldığı süreler detaylıca incelenmiştir. Karşılaştırmalı hız testleri 700 bin ile 6.7 milyon arasında bilinmeyen içeren ağlarda yapılmıştır. CPU'daki paralelleştirmeler Intel'in MKL kütüphanesi ve OpenMP ile GPU'daki paralelleştirmeler ise çoğunlukla CUBLAS, CUSPARSE ve CUSP kütüphaneleri gerektiğinde ise GPU üzerinde çalışacak kerneller yazılarak yapılmıştır. Denenen en büyük ağ için GPU, CPU'nun 1 izleği (thread) ve 8 izleği (8 threads) karşısında sırasıyla 5.79 kat ve 1.86 hızlı çalışmaktadır. Kayan noktalı sayıların tek hassasiyetli depolanması durumu özel olarak incelenmiş ve bu durumda çözüm doğruluğunda bir kötüleşme tespit edilmemekle birlikte, hem CPU'da hem GPU'da 2 kat hızlanma kaydedilmiştir. Açık (explicit) kademeli adım tekniği ile karşılaştırıldığında kapalı (implicit) yöntemin zamana bağlı olmayan problemleri daha hızlı çözdüğü görülmüş, buna karşın açık kademeli adım tekniğinin daha az hafıza kullandığı ortaya çıkmıştır.
Özet (Çeviri)
In recent years clock speeds and memory bandwidths of Graphics Processing Units (GPUs) increased dramatically compared to CPUs. Also GPU vendors developed and freely released new programming tools to make scientific computing on GPUs easier. With these recent developments the use of GPUs for general purpose computing becomes a popular research field. Researchers previously demonstrated that use of GPUs may provide tens of times of speeds-ups compared to CPU solvers for CFD methods such as Smoothed Particle Hydrodynamics, Lattice Boltzmann and Discontinuous Galerkin, which are known to offer very high parallelization potential. However, studies for the utilization of GPUs for classical finite volume and especially for finite element based CFD codes are rare in the literature. This study involves the development of a flow solver based on the Finite Element Method (FEM) working parallel on GPUs. CUDA (Compute Unified Device Architecture) programming toolkit developed by NVIDIA is used for GPU programming. Three-dimensional, laminar, incompressible, flows with possible heat transfer effects are considered. Governing equations are discretized using 2 different fractional step algorithms. Accuracy of the developed solver is tested using 5 benchmark problems, including a microchannel flow and flow inside a tube with conjugate heat transfer. Each step of the fractional step algorithm is investigated in detail on the CPU and GPU for run time performance. Speed-up tests are performed on a series of meshes with total number of unknowns between 700,000 and 6.7 million. Parallelization on the CPU is achieved by using Intel's MKL library and OpenMP and on the GPU mostly CUBLAS, CUSPARSE and CUSP libraries are used with some scratch-built GPU kernels whenever necessary. For the largest mesh tried, GPU usage resulted in 5.79 and 1.86 times speed-ups compared to single-thread and 8-thread CPU solutions, respectively. The use of single precision arithmetic is investigated from accuracy and efficient points of view and it is seen that it does not degrade accuracy, while providing almost 2 times speed-up both on the CPU and the GPU. Compared to the explicit version, implicit fractional step algorithm turned out to be advantageous in terms of run time for steady state problems. On the other hand, explicit method uses less memory as expected.
Benzer Tezler
- FPGA based hardware accelerator for euler equations with finite volume method
Euler denklemleri için sonlu hacimler yöntemi ile FPGA tabanlı donanım hızlandırıcı
EMİNE ELİF YİĞİT
Yüksek Lisans
İngilizce
2024
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiSavunma Teknolojileri Ana Bilim Dalı
DR. ÖĞR. ÜYESİ RAMAZAN YENİÇERİ
- İstanbul metrosu Kabataş Mecidiyeköy hattı km 1+500 – km2+100 arasında tünel kazılarına bağlı gelişen yüzeydeformasyonlarının değerlendirilmesi
Assessment of surface settlements induced by tunneling between km 1+500 – km 2+100 of Kabataş – Mecidiyeköy line in İstanbul metro
JAVIDAN ALAKBAROV
Yüksek Lisans
Türkçe
2021
Jeoloji Mühendisliğiİstanbul Teknik ÜniversitesiJeoloji Mühendisliği Ana Bilim Dalı
DOÇ. DR. YILMAZ MAHMUTOĞLU
- A parallel monolithic approach for the numerical simulation of fluid-structure interaction problems
Akışkan-yapı etkileşimi problemlerinin sayısal simülasyonu için paralel monolitik bir yöntem
ALİ EKEN
Doktora
İngilizce
2016
Havacılık Mühendisliğiİstanbul Teknik ÜniversitesiUçak ve Uzay Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. HAYRİ ACAR
DOÇ. DR. MEHMET ŞAHİN
- Approaches to the modeling of inelasticity and failure of rubberlike materials
Başlık çevirisi yok
HÜSNÜ DAL
Doktora
İngilizce
2012
İnşaat MühendisliğiTechnische Universität DresdenYapı Malzemesi Ana Bilim Dalı
PROF. MICHAEL KALISKE
- Torna takımlarında mikro yüzey teksürü uygulamasının kesme kuvvetlerine etkisinin incelenmesi
Investigation of micro surface texture application on turning tools on cutting forces
EMRE AKI
Yüksek Lisans
Türkçe
2023
Makine Mühendisliğiİstanbul Teknik ÜniversitesiMakine Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ CANAN GAMZE GÜLERYÜZ PARASIZ
DR. ÖĞR. ÜYESİ ALİ TANER KUZU