Parallel solution of unsteady, incompressible three-dimensional Navier-Stokes equations with a new implicit method

Zamana bağlı, sıkıştırılamaz, üç boyutlu Navier-Stokes denklemlerinin yeni bir kapalı metodlar paralel çözümü

PDF İndir

Tez No: 143110
Yazar: VİLDAN ÜSTOĞLU ÜNAL
Danışmanlar: PROF. DR. ÜLGEN GÜLÇAT
Tez Türü: Doktora
Konular: Astronomi ve Uzay Bilimleri, Astronomy and Space Sciences
Anahtar Kelimeler: Belirtilmemiş.
Yıl: 2003
Dil: İngilizce
Üniversite: İstanbul Teknik Üniversitesi
Enstitü: Fen Bilimleri Enstitüsü
Ana Bilim Dalı: Astronomi ve Uzay Bilimleri Ana Bilim Dalı
Bilim Dalı: Belirtilmemiş.
Sayfa Sayısı: 146

Özet

Bilgisayar uygulamalı metodlar, sayısal tekniklerin gelişimi ve bilgisayar performansmdaki artışla, endüstride ekonomik bir dizayn ve analiz aracı haline gelmiştir. Akışı, türbülans veya karmaşık akışlar gibi, hassas olarak simüle edebilmek için bilgisayar kapasitesinin artmasına duyulan talep halen mevcuttur. Günümüz bilgisayarlarının sınırlı gücü, ekonomik analizlerin yapılması açısından, bilgisayar uygulamalı algoritmaların gelişmesini gerektirmektedir. Bu talepler göz önünde bulundurulduğunda, paralel hesaplama, günümüzde akışın etkin bir şekilde çözümlenmesi ve hassas sunumunun elde edilmesinde önemli bir rol almaktadır. Bu çalışmanın amacı, laminer ve türbülans akışların modellenmesinde temel araç olan zamana bağlı, sıkıştınlamaz, üç boyutlu Navier-Stokes denklemlerinin sayısal çözümü için yeni bir kapalı metod kullanarak, etkin bir paralel algoritma kurmak ve uygulamaktır. İncelenen problemlerin büyüklüğü ve karmaşıklığı, paralel hesaplamanın etkin kullanımını gerektirmektedir. Paralel programlama öncelikle hesaplamaları hızlandırmak için kullanılır, bir paralel algoritma mümkün olan en iyi sıralı çözümden bile oldukça hızlı olabilir, bu şekilde hızlı çözümlere özellikle ihtiyaç duyulmaktadır. Paralel hesaplama uygulamaları gün geçtikçe artmaktadır. Bu uygulama alanlarında, günümüzde veya gelecekte hiçbir klasik bilgisayarın sağlayamayacağı kadar yüksek hesaplama hızına ihtiyaç duyulmaktadır. Paralel hesaplama tekniği, günümüzde bu hesaplamaları mümkün kılabilecek tek yaklaşım olarak bilinmektedir. Bu çalışma, paralel algoritmaların gelişimine katkıda bulunmayı amaçlamıştır. Hafıza gereksinimi ve hesaplama zamanı dikkate alınması gereken önemli konular olduğundan, denklemlerin aynklaştınlmasmda kullanılacak şema yüksek derecede hassas, hızlı ve verimli olmalıdır. Genellikle çok fazla nokta kullanılarak çözümlenebilen karmaşık akışlarda, açık şemalar kararlılık şartlarından dolayı atılacak zaman adımı büyüklüğüne önemli kısıtlamalar getirmektedir. Bu nedenle, bu tarz akışların incelenmesinde kapalı çözücüler tercih edilmektedir. Kapalı algoritmalar, daha büyük zaman adımları kullanabilir. Çözüme ulaşmak için atılacak zaman adımlarmdaki azalmadan dolayı, bloklar arasındaki alışverişin de azalması sayesinde, bir kapalı şema, paralel hesaplamalar söz konusu olduğunda, açık şemaya göre daha avantajlı hale gelebilir. Bu çalışmada ilk adım, bazı algoritmaların hassasiyet ve hesaplama zamanı açısından, kapalı şema kullanılan programı sıralı olarak koşturarak test edilmesi ile atıldı. Paralel kapalı şema kullanılacak olan programlamaya geçmeden önce, paralel işlemciliğe en uygun olan algoritma seçildi. Programın sıralı olarak koşturulmasıyla test edilen dört yöntem arasında, direkt çözümle yardımcı potansiyel fonksiyonunu elde eden formülasyon şekli, gerek hesaplama zamanı gerekse paralel programlama uygulama kolaylığı açısından, en verimli metod olarak gözlenmiştir. Kapalı şema kullanan program, basınç alanına ulaşmakta kullanılacak olan yardımcı potansiyel fonksiyonunu direkt çözümle elde edecek şekilde yenilenmiştir. Bu tez yeni bir kapalı metodu araştırmakta ve temel denklemlerin kapalı çözümünde kullanılacak olan yeni bir paralel algoritmayı geliştirmektedir. Momentum denkleminin zaman aynklaştırmasmda yemlenmiş kesirli zaman adımı metodu kullanılırken, uzayda aynklaştırma Galerkin Sonlu Elemanlar Metodu ile brik elemanlar kullanılarak yapılmaktadır. Kullanılan şema zamanda ve uzayda ikinci mertebedendir. Bu da akış alanının, atılacak zaman adımı büyüklüğüne bir sınırlama getirmeden az sayıda nokta kullanılarak çözümlenmesine izin vermekte, böylelikle kapalı şemada kullanılan matrislerin boyutu da küçülmektedir. Düzgün ve düzgün olmayan ağ yapılan kullanılmıştır. Düğüm numaralandırması, özellikle en az yarı bant genişliğini verecek ve böylelikle hafıza açısından kazanç sağlayacak ve hesaplama zamanını azaltacak şekilde düzenlenmiştir. Her zaman adımında momentum denklemi, yan zaman adımı hız alanı elde etmek için paralel olarak çözülmektedir. Yan zaman adımı hız alam kullanılarak, Poisson denklemini sağlayan yardımcı potansiyel fonksiyonu paralel olarak hesaplanmakta ve basınç alanına ulaşılmaktadır. Paralel performans değerlendirmesi için, yardımcı potansiyel fonksiyonu yerine direkt basıncı hesaplama yolu da test edilmiş, fakat yardımcı potansiyel fonksiyonunu kullanan Poisson denkleminin paralel çözümünün direkt basınç formülasyonu kullanan paralel çözüme göre daha az hesaplama zamanı aldığı gözlenmiştir. Bölgelere ayırma tekniğine dayanan paralel hesaplamalar, büyük ölçekli veya karmaşık akış problemlerinin çözümünü mümkün kılmaktadır. Matris denklemlerimizin paralel kapalı çözümünde, yenilenmiş Bölgelere Ayırma Metodu, momentum ve Poisson denklemlerinin örtüşmeyen fakat eşleşen alt bölgeler kullanılarak paralel çözümü için, etkin hale getirilmiştir. Çözüm alanı bir çok alt bölgelere, köleler, aynlır ve iş istasyonlanna dağıtılır. Köle işlemciler arakesit verilerini başlangıç ve sonuçlandırma işlemlerinden sorumlu ana işlemci ile değiştirirler. Hesaplamalar ilerledikçe, köleler sınır bilgilerini de ana işlemci ile periyodik olarak değiştirirler. İşlemler sonrasında global çözüm, işlemcilerdeki çözümlerin bir araya getirilmesi ile ortaya konur. Arakesitlerde doğru Neuman şartlan elde edilinceye kadar arakesit iterasyon döngüsü devam eder. Bu tezde gerek yan zaman adımı hız alanı gerekse yardımcı potansiyel fonksiyonu için en iyi arakesit iterasyon kriterleri çok sayıda denemeler sonucu bulunmuş, ve kararlı ve hassas çözüm için gereken en iyi kriterler sunulmuştur. Bulunan doğru arakesit şartlanyla beraber her bölgede denklemler birbirinden bağımsız olarak çözülür ve sonunda birleştirilerek global çözüm tamamlanmış olur. İç iterasyon döngüsü ve dış zaman adımı gelişmelerini kapsayan hesaplamalar, her işlemcide ana işlemciyle haberleşilerek paralel bir şekilde çıkanlmalıdır. İlk paralel çalışmalar, birbirleriyle bir 100 Mbps TCP/IP ağ yardımı ile bağlı iş istasyonlannm (DEC Alpha XL266) gerektiğinde PVM 3.3 (Parallel Virtual Machine) ile haberleşmesi ile Linux işletim sisteminde yapılmış, daha sonra ise bu çalışmalar, sekiz işletimcinin bulunduğu yeni bir paralel Unix işletim sisteminde (SGI O3000) devam ettirilmiştir. Yeni kapalı paralel şema uygulaması, kapağı çekilen küp oyuk içerisindeki, Reynolds sayısı 400 ve 1000 alman akım problemi için kalibre edilmiştir. Hesaplamalar, toplam hesap noktası (21x11x21), (25x13x25), (49x25x49) ve (55x28x55) olan, 2, 4 ve 6 bölgeli ayrımlarda devam etmiştir. 0.1 gibi büyük bir zaman adımı ve en küçük 0.014 ağ büyüklüğü kullanılarak, 25 boyutsuz zamanda yakınsama sağlanmıştır. Çözümler, referanslarla karşılaştınlmıştır. Referanslardakilere göre çok az sayıda çözüm noktası kullanılmasına rağmen, iyi bir uygunluk sağlanmıştır. Özellikle sonuçların referans değerlerine yakınlaşmasının artmasında, oyuk duvarlarına yakın bölgelerde sıkı ağ kullanılması etkili olmaktadır. Kapağı çekilen küp oyuk içerisindeki ana ve ikincil akışlar ve Reynolds sayısı etkileri, değişik kesitler için sunulmuştur. Akışın simetrik karakteri, tüm oyuk geometrisi ele alınarak yapılan sayısal çözümle gösterilmiş ve bu tezde hesaplamalar tümüyle simetrik yarıyı kapsamıştır. DEC Alpha XL266 iş istasyonlarında, eşit sayıda çözüm noktası kullanılan 2, 4 ve 6 bölgeli aynklaştırmalar üzerinde elde edilen ilk paralel sonuçlar, bu iş istasyonlarında yük dengelemesi yapılmasının gerekliliğini göstermiştir. Burada hızlanma yeterli derecede olmamıştır. İki ayrı paralel çözüm şeması uygulanmıştır. Hızlanmayı arttırmak için yük dengelemesi yapılmış ve ideal hızlanma elde edilmiştir. Yük dengelemesi, ana işlemcinin yavaşlığından dolayı uğranılan hızlanma kaybını önlemek üzere, neredeyse tüm paralel hesaplamaların köleler üzerinde yapılması esasına dayandırılmıştır. Kapağı çekilen küp oyuk problemi için paralel çözüm, 2 bölge kullanılarak 4105, 4 bölge ile 1719 ve 6 bölge ile 1579 saniyede (toplam hesaplama zamanı), DEC Alpha XL266 iş istasyonları üzerinde, elde edilmiştir. DEC Alpha iş istasyonlarında hızlanmayı arttırmak için gerekli olan bu paralelleştirme yapısı, SGI 03 000 sisteminde ilk başta uygulanan paralel yapıya göre daha olumsuz sonuç vermiştir. Paralel uygulamada kullanılan paralel işlemciler eğer birbirine nitelik, hız, haberleşme hızı açısından denk ise, iyi bir paralel performans için, problemi çözmek için gereken toplam hesaplamalar eşit olarak işlemciler arasında paylaştırılır. Tablo 7.6'da da görülebileceği gibi, bütün arakesit datasını işleyecek olan ana işlemcinin, kölelerden daha hızlı olması, paralel performansı arttırmaktadır. Bölüm 9, Kısım 9.3' de açıklanan bölgelere aynklaştırma denklemlerinde yapılan son yeniliklerle, özellikle çok fazla miktarda olan yardımcı potansiyel fonksiyonu arakesit iterasyonlan yaklaşık yüzde elli oranında azaltılmıştır. Arakesit Neumann sınır şartlan, her zaman adımı başında, sıfır yerine, bir önceki zaman adımı arakesit iterasyonlan sonucu yakınsamış değere eşitlenmiştir. Bölgelere Ayırma Metodunun başlangıç bölümünde, her alt bölge, bir önceki zaman adımında yakınsamış değere eşitlenmiş Neumann şartı ile beraber Poisson denklemini çözer. Bölgelere Ayırma Metodu, bu düşünceye göre düzenlenmiştir ve sonunda arakesit hesaplamalan daha kolay yakınsamış ve iterasyon sayısı etkin bir şekilde azaltılmıştır. Arakesit sayısı arttıkça iterasyon sayısı da arttığından, iterasyon sayısının düşürülmesi, aynı zamanda baş ve köle işlemciler tarafından yapılan paralel hesaplamalara da azalmasını sağlamıştır. Böylelikle hızlanma artmıştır. Üstelik hesaplama zamanı azalmış ve süper-lineer hızlanma başarılmıştır. Bu son yemliklerle, SGI Origin 3000 sisteminde, 2 bölgeli paralel çözüm zamanına (toplam hesap zamanı) göre hesaplanmış hızlanma değeri, 2.30'dan 2.71 'e 4 bölgeli aynklaşmayla ve 2.40'dan 3.12'ye 6 bölgeli aynklaşmayla yükselmiştir. Hızlanma, kölelerin CPU zamanı kullanılarak hesaplandığında, dört bölgede 3.3 1 'e ve 6 bölgeli hesaplamalarda 5.69'a kadar çıkmıştır.

Özet (Çeviri)

Computational methods became a cost-effective design and analysis tool for the industry with the increasing performance of computers and developments in numerical techniques,. Demand for increased computational effort for accurate simulation of the flow, such as turbulence or complex flows, still exists. The limited computational power of the day requires the development of computational algorithms to perform cost effective analysis. Considering these demands, parallel computation became an important task in recent years in order to get efficient solutions and accurate representation of the flow. The objective of this study is to construct and apply an efficient parallel algorithm using a new implicit method for the solution of unsteady, incompressible three- dimensional Navier-Stokes equations, which are the fundamental tool for modelling laminar and turbulent flows. The size and complexity of the problems considered necessitates the utilization of parallel computing. Parallel programming is used primarily to speed up computations. A parallel algorithm can be significantly faster than the best possible sequential solution. Such fast solutions are truly needed. There is a growing number of applications of parallel computing. These fields require computing speeds that can not be supplied by any current or future conventional computer. Parallel computation is the only approach known today that would make these computations feasible. This study aims to contribute towards the development of parallel algorithms. The scheme in discretizing the equations must be of high-order accuracy, fast and efficient, since memory requirements and computing times are important subjects to be considered. Because of the stability requirements, explicit schemes impose severe restrictions on the time step size for complex flows, which are generally resolved with sufficiently fine grids. Therefore, the implicit flow solvers are preferred in the study of such flows. An implicit algorithm can use larger time steps. Because of the reduced number of time-steps to reach the solution, an implicit solver may outperform an explicit one in parallel computing by reducing the total amount of inter-block communications. Thus, in this study, the first step is realized by testing some algorithms by the implicit sequential runs, considering the accuracy and computational time. The most suitable one for parallel processing is chosen before starting the parallel programming. Among the four methods tested by the sequential runs, the direct auxiliary potential formulation has been observed to be more efficient in terms of computational time and easier programming. The implicit computational code has been modified in such a way that the solution is obtained by the direct auxiliary potential function formulation for the pressure. This thesis investigates a new implicit method and develops a new parallel algorithm for the implicit solution of the governing equations. The space is discretized with brick elements by the Galerkin Finite Element Method, while modified version of the two-step fractional method is used in time discretization of the momentum equation. The scheme is second-order accurate in both time and space. This allows us to resolve the flow field with less number of points while taking large time steps so that the size of the matrix to be inverted in the implicit method becomes small. Both uniform and nonuniform grids are used. The node numbering is specially arranged to obtain the minimum half-bandwidth, to save from computer storage and to have an advantage in terms of computational time. At each time step, the momentum equation is solved by parallel computation to get the half time-step velocity field. Auxiliary scalar potential which satisfies Poisson's equation is obtained using the half time-step velocity field and the pressure at each time level is obtained. Direct pressure calculation instead of using auxiliary potential function is also tested for the parallel performance, but it is observed that the parallel solution of Poisson's Equation with auxiliary potential function formulation takes less computational time than that with the direct pressure formulation. Domain decomposition-based parallel computing makes it possible to solve large size or complex problems. For the parallel implicit solution of the matrix equations, modified versions of the Domain Decomposition Method is utilized for parallel solution of both the momentum and Poisson equations using non-overlapping matching sub-domains. The computational domain is divided into several sub- domains, or slaves, and distributed among the workstations for concurrent processing. The slave processors exchange the interface data with the master processor, which is responsible for pre- and post-processing. Slaves periodically exchange boundary information with the master, as the computation progresses. The global solution is then put together during post-processing. Interface iteration cycle goes on until the correct interface Neumann boundary condition is found. In this thesis the best interface iteration convergence criteria for both half-time level velocity field and the auxiliary potential function is found with a lot of computational experiments, and the best ones for the stable and accurate solution is presented. The global solution is then assembled by solving the equations for each block separately together with the correct interface conditions. The computations involving an inner iterative cycle and outer time step advancements have to be performed in a parallel manner on each processor communicating with the master processor. The first results are obtained on a cluster of DEC Alpha XL266 workstations running Linux operating system, interconnected with a 100 Mbps TCP/IP network. Public version of the PVM 3.3 is used as the communication library. But the latest studies are developed on SGI Origin 3000 with 8 processor running Unix operating system. The new implicit parallel implementation is calibrated for the lid-driven cubic cavity problem with Reynolds number of 400 and 1000. Computations are carried on 2, 4 and 6-partitioning domains with total number of 21x11x21, 25x13x25, 49x25x49 and 55x28x55 nodes. The steady state is reached in 25 dimensionless time, with a large step-size of 0.1 and with a minimum grid size of 0.014. The results are compared with the benchmark solutions. They give well agreement although coarser grids are used compared to those used at the benchmark computations. The agreement with the benchmark results is increased with fine grids, especially with fine stretched cells along the walls of the cavity. The primary and secondary flows inside the lid-driven cubic cavity and the effect of Reynolds number are presented for different cross- sections. Full geometry solution of the lid-driven cubic cavity proved that the flow inside the lid-driven cavity is symmetric so that the computation included only the symmetric part. The first parallelization results on 2, 4 and 6-domain partitioning, having equal number of grid points, show that the parallel computation on DEC Alpha XL266 workstations necessitates the load balancing. In this case, the speed-up is not good enough. Two more paralellization schemes are tested. Load balancing is applied to increase the speed-up on the cluster of workstations and an ideal value of speed-up is obtained. The load balance is done in such a way that the slave processors handle almost all of the domain decomposition calculations so that the decrease in parallel efficiency, caused by the slow master processor, can be prevented. Parallel computation for lid-driven cubic cavity problem takes 4105 seconds with 2-domain, 1719 seconds with 4-domain and 1579 seconds (elapsed time) with 6-domain partitionings, on DEC Alpha XL266 workstations. The parallelization structure applied to increase the speed-up on DEC Alpha XL266 workstations gives worse results on SGI 03 000 system, compared to the parallel structure applied at the beginning of the thesis. If all the processors used in the parallel computations have the same quality, speed and communication speed, all of the parallel work to solve the interested problem should be distributed equally to each processor. As it can be seen in Table 7.6, in parallel computation the speed-up increases efficiently if the speed of master processor, for pre- and post processing, is higher than the speed of slave processors. With the last modification of the domain decomposition equations explained in Chapter 9 Section 9.3, the number of interface iterations, especially the high number of auxiliary potential iterations, is decreased by approximately 50 percent. The interface Neumann boundary conditions at the beginning of each time level are set not equal to zero, but to the converged value which is found out at the end of the interface iterations at the previous time level. At the initialization part of Domain Decomposition Method, each sub-domain solves Poisson equation together with the Neumann condition set equal to the converged value which is obtained at the end of the old time level interface iterations. The domain decomposition equations are modified with this idea, and finally, interface computations are seen to converge more easily, the number of iterations being reduced efficiently. Since the iterations increase with the increasing number of interface, the reduction of iterations also reduce the parallel calculations done by the master and the slave processors. Consequently, the speed-up increases. Moreover, the computational time is decreased and super-linear speed-up is achieved. With this latest modification, the speed-up based on the 2-domain computation time (elapsed-time) is increased from 2.30 to 2.71 on 4-domain partitioning, and from2.40 to 3.12 on 6-domain partitioning, on SGI Origin 3000 system. Speed-up, calculated using slave CPU time, is 3.31 on 4-domain and rises up to 5.69 on 6- domain partitioning computations.

Benzer Tezler

Tez No
421178
A parallel monolithic approach for the numerical simulation of fluid-structure interaction problems
Akışkan-yapı etkileşimi problemlerinin sayısal simülasyonu için paralel monolitik bir yöntem
ALİ EKEN
Doktora
İngilizce
2016
Havacılık Mühendisliği İstanbul Teknik Üniversitesi
Uçak ve Uzay Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. HAYRİ ACAR
DOÇ. DR. MEHMET ŞAHİN
Tez No
21906
Numerical simulation of 2-D laminar flow heat generation and forced convection from rectangular blocks in a narrow channel
Dar bir kanal içinde dikdörtgen bloklar etrafında laminer akış, ısı üretimi ve zorlanmış taşımanın 2 boyutlu benzeşimi
İBRAHİM ÖZKOL
Doktora
İngilizce
1992
Uçak Mühendisliği İstanbul Teknik Üniversitesi
DOÇ. DR. C. RUHİ KAYKAYOĞLU
Tez No
849005
Gemi direnç ve sevk performanslarının GEOSIM yöntemi, deneysel ve hesaplamalı akışkan dinamiği ile analizi
Analysis of ship drag and propulsion performances with GEOSIM method, experimental and computational fluid dynamics
CİHAD DELEN
Doktora
Türkçe
2023
Gemi Mühendisliği İstanbul Teknik Üniversitesi
Gemi İnşaatı ve Gemi Makineleri Mühendisliği Ana Bilim Dalı
PROF. DR. ŞAKİR BAL
Tez No
21972
Sınır tabaka denklemlerinin sayısal çözümlemesi
Numerical solution of boundary layer equations
RECEP ATEŞ
Yüksek Lisans
Türkçe
1992
Makine Mühendisliği İstanbul Teknik Üniversitesi
DOÇ. DR. TANER DERBENTLİ
Tez No
232432
Viskoz ve sıkıştırılamayan iki akışkandan oluşan karışım için zamana bağlı genelleştirilmiş couette akımı ile ilgili analitik çözümler
Analytical solutions for unsteady generalized couette flow of a binary mixture of imcompressible viscous fluids
MEHMET ŞİRİN DEMİR
Yüksek Lisans
Türkçe
2008
Makine Mühendisliği İstanbul Üniversitesi
Makine Mühendisliği Ana Bilim Dalı
DOÇ. DR. SERDAR BARIŞ

Geri Dön