Initialising ...
Initialising ...
Initialising ...
Initialising ...
Initialising ...
Initialising ...
Initialising ...
襲田 勉*; 丸山 訓英*; 鷲尾 巧*; 土肥 俊*; 山田 進
情報処理学会論文誌, 41(SIG8), p.92 - 100, 2000/11
共有メモリベクトル並列計算機の演算性能を最大限に引き出すような、ランダムパース行列のためのBlock(ブロック)ILU前処理付き反復法のベクトル・並列化手法を提案し、その手法を並列ベクトル型スーパーコンピュータSX-4(SRAM版,1CPUのピーク性能2GFlops)上で性能評価した結果を示す。ここでブロックとはある格子点上に定義された複数の未知数からなる集合とする。ベクトル処理をすることが難しいとされるBILU前処理演算のベクトル化のためにIDS-JAD(In Dependent Set Jagged Diagonal)形式を導入し、共有メモリベクトル並列化のためにMJAD(Multiple JAD)形式を導入した。IDS-JAD形式の導入により間接アドレス参照によるメモリアクセスの負荷が低減され、不要な演算を除去できる。MJAD形式の導入によりCPU間の周期回数が低減できる。3次元構造解析問題(GeFEM Tiger V1.0)を用いた約100万自由度の評価例題を使った数値実験において、1CPUで1.0GFlops,8CPUで6.8GFlopsを達成した。