検索対象:     
報告書番号:
※ 半角英数字
 年 ~ 
 年

Tree cutting approach for reducing communication in domain partitioning of tree-based block-structured adaptive mesh refinement

木構造ブロック細分化格子の領域分割における挿木法による通信量削減

長谷川 雄太   ; 青木 尊之*; 小林 宏充*; 井戸村 泰宏   ; 小野寺 直幸   

Hasegawa, Yuta; Aoki, Takayuki*; Kobayashi, Hiromichi*; Idomura, Yasuhiro; Onodera, Naoyuki

格子ボルツマン法を用いた空力解析を対象として、ブロック適合細分化格子法(AMR)を実装した。AMRにはforest-of-octreesに基づく木構造データを用い、領域分割法として空間充填曲線(SFC)を用いた。袖領域通信の削減のため、SFCに基づく領域分割に対して挿木法を提案した。これは、計算領域をいくつかの小領域に分割し、粗い構造格子的な領域分割と、細かいSFCによる領域分割に基づく階層的な領域分割を与える手法である。挿木法は、分割された領域の局所性を改善するとともに、袖領域の通信量および隣接プロセス数を削減することができる。Tesla V100 GPUスパコンで強スケーリングを測定したところ、挿木法により、従来のSFCに比べて1.82倍の高速化、および、128GPUで2207MLUPSの計算性能を達成した。

We developed a block-structured static adaptive mesh refinement (AMR) CFD code for the aerodynamics simulation using the lattice Boltzmann method on GPU supercomputers. The data structure of AMR was based on the forest-of-octrees, and the domain partitioning algorithm was based on space-filling curves (SFCs). To reduce the halo data communication, we introduced the tree cutting approach, which divided the global domains with a few octrees into small sub-domains with many octrees, leading to a hierarchical domain partitioning approach with the coarse structured block and the fine SFC partitioning in each block. The tree cutting improved the locality of the sub-divided domain, and reduced both the amount of communication data and the number of connections of the halo communication. In the strong scaling test on the Tesla V100 GPU supercomputer, the tree cutting approach showed $$times$$1.82 speedup at the performance of 2207 MLUPS (mega-lattice update per second) on 128 GPUs.

Access

:

- Accesses

InCites™

:

Altmetrics

:

[CLARIVATE ANALYTICS], [WEB OF SCIENCE], [HIGHLY CITED PAPER & CUP LOGO] and [HOT PAPER & FIRE LOGO] are trademarks of Clarivate Analytics, and/or its affiliated company or companies, and used herein by permission and/or license.