検索対象:     
報告書番号:
※ 半角英数字
 年 ~ 
 年

Communication reduced multi-time-step algorithm for the AMR-based lattice Boltzmann method on GPU-rich supercomputers

GPUスーパーコンピュータでの適合細分化格子ボルツマン法に適した通信削減アルゴリズム

小野寺 直幸  ; 井戸村 泰宏  ; Ali, Y.*; 下川辺 隆史*

Onodera, Naoyuki; Idomura, Yasuhiro; Ali, Y.*; Shimokawabe, Takashi*

本発表ではポスト京用に開発した通信削減マルチタイムステップ法をGPUスーパーコンピュータに適用し、性能測定を行った。この手法はテンポラルブロッキング法に基づいた手法であり、ボトルネックとなる通信部分を他の計算に置き換えることで、通信削減が可能となる。本アルゴリズムを適用した風況解析コードCityLBMを用いて、TSUBAMEおよびReedbushにて性能測定を行なった結果、弱スケーリングで64%に通信量が削減された。本アルゴリズムの適用で、都市部の2km四方の領域に対して、5m/s程度の風速の実時間風況予測が可能であることが確認されると共に、今後のエクサスケールのスーパーコンピュータに対して非常に有効であることが示された。

We have developed a communication reduced multi-time-step (CRMT) algorithm for the Post-K supercomputer, and measured the performance on the GPU-based supercomputers. This algorithm is based on the temporal blocking method, and can improve computational efficiency by replacing a communication bottleneck with additional computation. The proposed method is easily applied to the explicit time integration scheme, and is implemented on an extreme scale airflow simulation code CityLBM. We evaluate the performance of the CRMT algorithm on GPU based supercomputers, TSUBAME and Reedbush. Thanks to the CRMT algorithm, the communication cost is reduced by 64%, and weak and strong scaling are improved up to 200 GPUs. The obtained performance indicates that real time airflow simulations for about 2 km square area with the wind speed of 5m/s is feasible using 1m resolution. We conclude that the CRMT algorithm is indispensable for the AMR-LBM to realize a real time simulation on future exascale systems.

Access

:

- Accesses

InCites™

:

Altmetrics

:

[CLARIVATE ANALYTICS], [WEB OF SCIENCE], [HIGHLY CITED PAPER & CUP LOGO] and [HOT PAPER & FIRE LOGO] are trademarks of Clarivate Analytics, and/or its affiliated company or companies, and used herein by permission and/or license.