検索対象:     
報告書番号:
※ 半角英数字
 年 ~ 
 年

GPGPU application to the computation of Hamiltonian matrix elements between non-orthogonal Slater determinants in the Monte Carlo shell model

モンテカルロ殻模型における非直交スレーター行列式間のハミルトン行列要素の計算に対するGPGPUの適用

富樫 智章*; 清水 則孝*; 宇都野 穣   ; 阿部 喬*; 大塚 孝治*

Togashi, Tomoaki*; Shimizu, Noritaka*; Utsuno, Yutaka; Abe, Takashi*; Otsuka, Takaharu*

核構造計算では、非直交なスレーター行列式間のハミルトン行列要素を数値計算する必要がしばしばあり、多くの場合、それは最も計算時間を要する部分となる。本論文では、GPGPU(GPUによる汎目的計算)を利用してこの数値計算を効率よく行うことが可能となったことを報告する。発表者らの以前の論文で、非直交なスレーター行列式間のハミルトン行列要素の計算は、行列積に帰着させることが可能であることが示された。この手法は浮動小数点計算の回数に対するメモリアクセスの比を大きくすることが可能なため、メインメモリへのアクセスがボトルネックとなるGPGPU計算にも有効である。モンテカルロ殻模型計算コードにGPGPU計算を実装し、計算速度を測定したところ、理論性能1.31TFLOPSのGPUに対し、最大0.6TFLOPSを超える実効性能を得ることができた。模型空間が大きいほど実効性能が高くなるため、大規模計算に対して特に有効である。

Computing Hamiltonian matrix elements between non-orthogonal Slater determinants is often needed for nuclear-structure calculations, and it is the most time-consuming part in many cases. In this paper, we demonstrate that utilizing GPGPU is an efficient way to perform this calculation. In our earlier study, we showed that the calculation of the Hamiltonian matrix elements between non-orthogonal Slater determinants is transformed into the multiplication of matrices. This method is useful for the GPGPU calculation because of less memory access compared to the usual method. We implement the GPGPU computation in the Monte Carlo shell-model code and measure the elapsed time. The resulting performance is over 0.6 TFLOPS for the GPU that has 1.13 TFLOPS peak performance. This method is particularly effective for large-scale calculations because higher efficiency is obtained for the calculation of larger model spaces.

Access

:

- Accesses

InCites™

:

パーセンタイル:30.04

分野:Computer Science, Theory & Methods

Altmetrics

:

[CLARIVATE ANALYTICS], [WEB OF SCIENCE], [HIGHLY CITED PAPER & CUP LOGO] and [HOT PAPER & FIRE LOGO] are trademarks of Clarivate Analytics, and/or its affiliated company or companies, and used herein by permission and/or license.