検索対象:     
報告書番号:
※ 半角英数字
 年 ~ 
 年

Element-wise implementation of iterative solvers for FEM problems on the cell processor; An Optimization of the FEM for a low B/F ratio processor

Cellプロセッサーにおける、要素指向的な実装を用いた有限要素法向け反復法ソルバー; 低B/F比プロセッサーに向けたFEMの最適化の一例

櫛田 慶幸

Kushida, Noriyuki

本研究では核融合シミュレーションに代表される、原子力分野のシミュレーションに必須である有限要素法について、非均質マルチコアプロセッサー(HMP)に適した新しい実装法を開発した。また、新しい実装法が理論的な性能解析からも有効であることを示した。HMPは米Intel社を含む多くのプロセッサーベンダーが製品化しており、次世代スーパーコンピューティングに使われることが確実である。しかしながら、その理論性能を達成するためには新しいプログラミング手法が必要であることがわかっており、早い段階で手法を確立することが望まれている。特に問題となっているのは、高い計算能力を持つ一方でプロセッサーへのデータ供給能力が相対的に低い点である。そのため、データの転送量及び見かけ上の転送時間を減らすことで全体の速度向上を図っている。この実装法をポワッソン方程式を例題にして実装し、従来手法との比較を行った。結果、新実装は、従来プロセッサーにおける従来の実装に比べて10倍の性能を示した。このため、新実装法はHMPのように高い計算能力と比較的低いデータ供給能力を持つプロセッサーに対して有効であることが示された。

I introduced a new implementation of the finite element method (FEM) that is suitable for the cell processors. Since the cell processors have a far greater performance and low byte per flop (B/F) rate than traditional scalar processors, I reduced the amount of memory transfer and employed memory access times hiding technique. The amount of memory transfer was reduced by accepting additional floating-point operations by not storing data if it was required repeatedly. In this study, such memory access reduction was applied to conjugate gradient method (CG). In order to achieve memory access reduction in CG, element-wise computation was employed for avoiding global coefficient matrices that causes frequent memory access. Moreover, all data transfer times were concealed behind the calculation time. As a result, my new implementation performed 10 times better than a traditional implementation that run on a PPU.

Access

:

- Accesses

InCites™

:

Altmetrics

:

[CLARIVATE ANALYTICS], [WEB OF SCIENCE], [HIGHLY CITED PAPER & CUP LOGO] and [HOT PAPER & FIRE LOGO] are trademarks of Clarivate Analytics, and/or its affiliated company or companies, and used herein by permission and/or license.