地球シミュレータにおけるカーネルループのベクトル性能予測
Vector performance prediction of kernel loops on Earth Simulator
横川 三津夫; 斎藤 実*; 萩原 孝*; 磯部 洋子*; 神宮寺 聡*
Yokokawa, Mitsuo; Saito, Minoru*; Hagiwara, Takashi*; Isobe, Yoko*; Jinguji, Satoshi*
地球シミュレータは、640台の計算ノードをクロスバスイッチで結合した分散主記憶型並列計算機である。計算オードは8つのベクトルプロセッサからなる共有メモリシステムである。ピーク性能は40Tflops,主記憶容量は10TBである。地球シミュレータ上のプログラムの実効性能を推定するための性能予測システムGSを開発した。GSのベクトル性能の予測精度を確認するために、3グループのカーネルループに対し、GSによる予測値とSX-4の測定値を比較した結果、実行時間の絶対誤差で0.89%,1.42%,6.81%が得られた。地球シミュレータの実効性能を予測した結果、 それぞれのグループで平均5.94Gflops,3.76Gflops,2.17Gflopsが得られた。
Earth simulator is a distributed memory parallel system which consists of 640 processor nodes connected by a full crossbar network. Each processor node is a shared memory system which is composed of eight vector processors. The total peak performance and main memory capacity are 40Tflops and 10TB, respectively. A performance prediction system GS for the Earth Simulator has been developed to estimate sustained performance of programs. To validate accuracy of vector performance prediction by the GS, the processing times for three groups of kernel loops estimated by the GS are compared with the ones measured on SX-4. It is found that the absolute relative errors of the processing time are 0.89%,1.42% and 6.81% in average for three groups. The sustained performance of three groups on a processor of the Earth Simulator have been estimated by the GS and those performance are 5.94Gflops,3.76Gflops and 2.17Gflops in average.