Initialising ...
Initialising ...
Initialising ...
Initialising ...
Initialising ...
Initialising ...
Initialising ...
長谷川 雄太; 青木 尊之*; 小林 宏充*; 井戸村 泰宏; 小野寺 直幸
Parallel Computing, 108, p.102851_1 - 102851_12, 2021/12
被引用回数:5 パーセンタイル:48.01(Computer Science, Theory & Methods)GPUスーパコンピュータに対して格子ボルツマン法(LBM: lattice Botltzmann method)およびforest-of-octreesに基づくブロック構造型の局所細分化格子(LMR: local mesh refinement)を用いた空力解析コードを実装し、その性能を評価した。性能評価の結果、従来の空間充填曲線(SFC; space-filling curve)に基づく領域分割アルゴリズムでは、本空力解析において袖領域通信のコストが過大となることがわかった。領域分割の改善手法として本稿では挿し木法を提案し、領域分割の局所性とトポロジーを改善し、従来のSFCに基づく手法に比べて通信コストを1/31/4に削減した。強スケーリング測定では、最大で1.82倍の高速化を示し、128GPUで2207MLUPS(mega-lattice update per second)の性能を達成した。弱スケーリング測定では、8
128GPUで93.4%の並列化効率を示し、最大規模の128GPU計算では44.73億格子点を用いて9620MLUPSの性能を達成した。
長谷川 雄太; 青木 尊之*; 小林 宏充*; 井戸村 泰宏; 小野寺 直幸
no journal, ,
格子ボルツマン法を用いた空力解析を対象として、ブロック適合細分化格子法(AMR)を実装した。AMRにはforest-of-octreesに基づく木構造データを用い、領域分割法として空間充填曲線(SFC)を用いた。袖領域通信の削減のため、SFCに基づく領域分割に対して挿木法を提案した。これは、計算領域をいくつかの小領域に分割し、粗い構造格子的な領域分割と、細かいSFCによる領域分割に基づく階層的な領域分割を与える手法である。挿木法は、分割された領域の局所性を改善するとともに、袖領域の通信量および隣接プロセス数を削減することができる。Tesla V100 GPUスパコンで強スケーリングを測定したところ、挿木法により、従来のSFCに比べて1.82倍の高速化、および、128GPUで2207MLUPSの計算性能を達成した。