検索対象:     
報告書番号:
※ 半角英数字
 年 ~ 
 年

Performance evaluation of a modified communication-avoiding generalized minimal residual method on many core platforms

メニーコア環境における修正省通信一般化最小残差法の性能評価

井戸村 泰宏; 伊奈 拓也*; 真弓 明恵; 山田 進; 松本 和也*; 朝比 祐一*; 今村 俊幸*

Idomura, Yasuhiro; Ina, Takuya*; Mayumi, Akie; Yamada, Susumu; Matsumoto, Kazuya*; Asahi, Yuichi*; Imamura, Toshiyuki*

本研究ではオリジナルの省通信一般化最小残差(CA-GMRES)法と同じ省通信特性を維持しつつ計算量とメモリーアクセスを30%削減する修正CA-GMRES法を提案する。より高い演算密度、かつ、より少ない通信量と計算量という演算特性はメモリ帯域幅と通信帯域幅が制限される将来のエクサスケール計算機に対して有望な特徴である。修正CA-GMRES法をジャイロ運動論的トロイダル5次元オイラーコードGT5Dの陰解法ソルバにおける大規模非対称行列に適用し、Oakforest-PACS(KNL)において性能評価を行った。数値実験結果から、一般化共役残差法と比べて、演算カーネルは1.5倍高速化され、1,280ノード利用時のデータ縮約通信コストは全体コストの12.5%から1%に削減されることが示された。

We propose a modified communication-avoiding generalized minimal residual (CA-GMRES) method, which reduces both computation and memory access by 30% with keeping the same CA property as the original CA-GMRES method. These numerical properties, less communication and computation with higher arithmetic intensity, are promising features for future exascale machines with limited memory and network bandwidths. The modified CA-GMRES method is applied to a large scale non-symmetric matrix in an implicit solver of the gyrokinetic toroidal five dimensional Eulerian code GT5D, and its performance is estimated on the Oakforest-PACS (KNL). The numerical experiment shows that compared with the generalized conjugate residual method, computing kernels are accelerated by 1.5x, and the cost of data reduction communication is reduced from 12.5% to 1% of the total cost at 1,280 nodes.

Access

:

- Accesses

InCites™

:

Altmetrics

:

[CLARIVATE ANALYTICS], [WEB OF SCIENCE], [HIGHLY CITED PAPER & CUP LOGO] and [HOT PAPER & FIRE LOGO] are trademarks of Clarivate Analytics, and/or its affiliated company or companies, and used herein by permission and/or license.