Initialising ...
Initialising ...
Initialising ...
Initialising ...
Initialising ...
Initialising ...
Initialising ...
小野寺 直幸; 井戸村 泰宏; Ali, Y.*; 山下 晋; 下川辺 隆史*; 青木 尊之*
Proceedings of Joint International Conference on Supercomputing in Nuclear Applications + Monte Carlo 2020 (SNA + MC 2020), p.210 - 215, 2020/10
本研究では、ブロック型局所細分化(AMR)法に基づくPoisson解法のGPU高速化を実施した。ブロック型AMR法はGPUに適したデータ構造であり、複雑な構造物で構成された原子炉等の解析に必須な解析手法である。これに、最新の前処理手法であるマルチグリッド(MG)法を共役勾配(CG)法へと組み合わせることで、計算の高速化を実現した。MG-CG法を構成する計算カーネルをGPUスーパーコンピュータであるTSUBAME3.0上にて測定した結果、ベクトル-ベクトル和、行列-ベクトル積、およびドット積の帯域幅は、ピークパフォーマンスの約60%となり、良好なパフォーマンスを実現した。更に、MG法の前処理手法として、3段のVサイクル法および各段に対してRed-Black SOR法を適用した手法を用いて、格子点の大規模問題の解析を実施した結果、元の前処理付きCG法と比較して、反復回数を30%未満に削減すると共に、2.5倍の計算の高速化を達成した。
井戸村 泰宏; 伊奈 拓也*; 山下 晋; 小野寺 直幸; 山田 進; 今村 俊幸*
Proceedings of 9th Workshop on Latest Advances in Scalable Algorithms for Large-Scale Systems (ScalA 2018) (Internet), p.17 - 24, 2018/11
被引用回数:8 パーセンタイル:92.04(Computer Science, Theory & Methods)多相流体CFDコードJUPITERの圧力ポアソン方程式に省通信マルチグリッド前処理付共役勾配(CAMGCG)法を適用し、省通信クリロフ部分空間法と計算性能と収束特性を比較した。JUPITERコードにおいてCAMGCGソルバ問題サイズによらずロバーストな収束特性を有し、通信削減と収束特性向上を両立することから、通信削減のみを実現する省通信クリロフ部分空間法に対する優位性が高い。CAMGCGソルバを億自由度の大規模多相流体CFDシミュレーションに適用して反復回数を前処理付CG法のに削減し、Oakforest-PACSにおける8,000ノードまでの良好な強スケーリングとCG法の倍の性能向上を達成した。
井戸村 泰宏
no journal, ,
省通信アルゴリズムは演算加速と相対的に低い通信バンド幅で特徴付けられる将来のエクサスケール計算機における大規模流体シミュレーションに向けたキーテクノロジーになっている。この通信ボトルネックを解決するために、5次元核融合プラズマ乱流コードGT5Dや3次元多相熱流動解析コードJUPITERといった大規模原子力シミュレーションにおいて2種類の省通信疎行列ソルバを開発した。一つは複数の基底ベクトルの生成と直交化を一度に行う省通信クリロフ法である。本手法により、従来のクリロフ法では反復毎に必要となっていたAll_Reduce通信のボトルネックを回避できる。もう一つの手法は、収束特性の改善により反復回数とAll_Reduce通信回数を削減する省通信マルグリット法である。この手法では混合精度のマルチグリッド実装によってさらに演算と通信を削減する。これらの省通信ソルバによりGT5DとJUPITERの性能が大幅に向上し、8,208台のKNLから構成されるOakforest-PACSにおいて全系まで強スケーリングを拡張した。