検索対象:     
報告書番号:
※ 半角英数字
 年 ~ 
 年

Development of exascale fusion plasma turbulence simulations for post-K

ポスト「京」に向けたエクサスケール核融合プラズマ乱流シミュレーションの開発

井戸村 泰宏   ; 伊奈 拓也*; Obrejan, K.; 朝比 祐一*   ; 松岡 清吉* ; 今村 俊幸*

Idomura, Yasuhiro; Ina, Takuya*; Obrejan, K.; Asahi, Yuichi*; Matsuoka, Seikichi*; Imamura, Toshiyuki*

ポスト京重点課題において、メニーコアプロセッサに基づく次世代計算環境向けにジャイロ運動論的トロイダル5次元オイラーコードGT5Dの計算技術開発を進めてきた。本発表では、複雑なプロセッサ内メモリ階層、および、演算加速に比べて限定的なノード間通信性能に関する計算技術の課題を議論する。前者に関しては、各メニーコアアーキテクチャ上でステンシル計算カーネルのデータアクセスパターンを最適化し、高い性能向上を達成した。後者に関しては、先進的な省通信クリロフ部分空間法を適用した。この手法は集団通信を一桁以上削減し、さらに主要な計算カーネルの演算密度を向上する。上記の新たな計算技術の適用により、最新メニーコア環境におけるGT5Dの性能が大幅に向上し、Oakforest-PACS全系(8,192KNL)までの良好な強スケーリングを達成した。

Under the post-K project, we have developed computing techniques of the Gyrokinetic Toroidal 5D full-f Eulerian code GT5D towards the next generation computing platforms based on many core processors. We discuss computational challenges related to complicated intra-processor memory hierarchy and limited inter-node communication performance compared with accelerated computation. The former issue is addressed by optimizing data access patterns of a stencil kernel on each many core architecture, and high performance gains are obtained. The latter issue is resolved by using advanced communication avoiding Krylov methods, which enables an order of magnitude reduction of collective communications and improves arithmetic intensity of main computing kernels. By applying these novel computing techniques, the performance of GT5D is dramatically improved on the latest many core platforms, and excellent strong scaling up to the full system size of the Oakforest-PACS (8,192 KNLs) is achieved.

Access

:

- Accesses

InCites™

:

Altmetrics

:

[CLARIVATE ANALYTICS], [WEB OF SCIENCE], [HIGHLY CITED PAPER & CUP LOGO] and [HOT PAPER & FIRE LOGO] are trademarks of Clarivate Analytics, and/or its affiliated company or companies, and used herein by permission and/or license.