地球シミュレータにおけるカーネルループのベクトル性能予測
Vector performance prediction of kernel loops on Earth Simulator
横川 三津夫; 斎藤 実*; 萩原 孝*; 磯部 洋子*; 神宮寺 聡*
Yokokawa, Mitsuo; Saito, Minoru*; Hagiwara, Takashi*; Isobe, Yoko*; Jinguji, Satoshi*
地球シミュレータは、640台の計算ノードをクロスバスイッチで結合した分散主記憶型並列計算機である。計算オードは8つのベクトルプロセッサからなる共有メモリシステムである。ピーク性能は40Tflops,主記憶容量は10TBである。地球シミュレータ上のプログラムの実効性能を推定するための性能予測システムGS
を開発した。GS
のベクトル性能の予測精度を確認するために、3グループのカーネルループに対し、GS
による予測値とSX-4の測定値を比較した結果、実行時間の絶対誤差で0.89%,1.42%,6.81%が得られた。地球シミュレータの実効性能を予測した結果、 それぞれのグループで平均5.94Gflops,3.76Gflops,2.17Gflopsが得られた。
Earth simulator is a distributed memory parallel system which consists of 640 processor nodes connected by a full crossbar network. Each processor node is a shared memory system which is composed of eight vector processors. The total peak performance and main memory capacity are 40Tflops and 10TB, respectively. A performance prediction system GS
for the Earth Simulator has been developed to estimate sustained performance of programs. To validate accuracy of vector performance prediction by the GS
, the processing times for three groups of kernel loops estimated by the GS
are compared with the ones measured on SX-4. It is found that the absolute relative errors of the processing time are 0.89%,1.42% and 6.81% in average for three groups. The sustained performance of three groups on a processor of the Earth Simulator have been estimated by the GS
and those performance are 5.94Gflops,3.76Gflops and 2.17Gflops in average.