※ 半角英数字
 年 ~ 


Improved domain partitioning on tree-based mesh-refined lattice Boltzmann method

長谷川 雄太   ; 青木 尊之*; 小林 宏充*; 井戸村 泰宏   ; 小野寺 直幸   

Hasegawa, Yuta; Aoki, Takayuki*; Kobayashi, Hiromichi*; Idomura, Yasuhiro; Onodera, Naoyuki

Forest-of-octreesに基づく局所格子細分化法(LMR)を導入した格子ボルツマン法(LBM)に基づく空力解析コードに対し、挿し木法による領域分割の改善手法を提案した。従来の空間充填曲線に基づく領域分割法は、適合格子細分化法(AMR)やLMRで広く用いられているものの、GPUスパコン向けに実装された本空力解析コードにおいては袖領域通信が増大し計算のボトルネックとなるうることが確認された。本研究で提案する挿し木法は、粗い等間隔格子状の領域分割と細かい空間充填曲線に基づく分割のハイブリッドによる手法である。挿し木法により、領域分割の局所性と幾何形状が改善しており、通信量が従来の空間充填曲線に基づく手法に比べて3分の1に削減された。8GPU並列による性能検証では、コード全体で1.23倍の高速化が確認された。また、強スケーリングにおいてさらに性能の改善が見られ、128GPUの強スケーリングにおいては、従来手法に比べて1.82倍の高速化を示し、2207MLUPS (mega-lattice update per second)の計算性能を達成した。

We introduce an improved domain partitioning method called "tree cutting approach" for the aerodynamics simulation code based on the lattice Boltzmann method (LBM) with the forest-of-octrees-based local mesh refinement (LMR). The conventional domain partitioning algorithm based on the space-filling curve (SFC), which is widely used in LMR, caused a costly halo data communication which became a bottleneck of our aerodynamics simulation on the GPU-based supercomputers. Our tree cutting approach adopts a hybrid domain partitioning with the coarse structured block decomposition and the SFC partitioning in each block. This hybrid approach improved the locality and the topology of the partitioned sub-domains and reduced the amount of the halo communication to one-third of the original SFC approach. The code achieved $$times 1.23$$ speedup on 8 GPUs, and achieved $$times 1.82$$ speedup at the performance of 2207 MLUPS (mega-lattice update per second) on 128 GPUs with strong scaling test.



- Accesses





[CLARIVATE ANALYTICS], [WEB OF SCIENCE], [HIGHLY CITED PAPER & CUP LOGO] and [HOT PAPER & FIRE LOGO] are trademarks of Clarivate Analytics, and/or its affiliated company or companies, and used herein by permission and/or license.