検索対象:     
報告書番号:
※ 半角英数字
 年 ~ 
 年
検索結果: 6 件中 1件目~6件目を表示
  • 1

発表形式

Initialising ...

選択項目を絞り込む

掲載資料名

Initialising ...

発表会議名

Initialising ...

筆頭著者名

Initialising ...

キーワード

Initialising ...

発表言語

Initialising ...

発行年

Initialising ...

開催年

Initialising ...

選択した検索結果をダウンロード

論文

地球シミュレータにおけるカーネルループのベクトル性能予測

横川 三津夫; 斎藤 実*; 萩原 孝*; 磯部 洋子*; 神宮寺 聡*

日本計算工学会論文集, 4, p.31 - 36, 2002/00

地球シミュレータは、640台の計算ノードをクロスバスイッチで結合した分散主記憶型並列計算機である。計算オードは8つのベクトルプロセッサからなる共有メモリシステムである。ピーク性能は40Tflops,主記憶容量は10TBである。地球シミュレータ上のプログラムの実効性能を推定するための性能予測システムGS$$^3$$を開発した。GS$$^3$$のベクトル性能の予測精度を確認するために、3グループのカーネルループに対し、GS$$^3$$による予測値とSX-4の測定値を比較した結果、実行時間の絶対誤差で0.89%,1.42%,6.81%が得られた。地球シミュレータの実効性能を予測した結果、 それぞれのグループで平均5.94Gflops,3.76Gflops,2.17Gflopsが得られた。

論文

A New memory allocation method for shared memory multiprocessors with large virtual address space

小出 洋; 鈴木 貢*; 中山 泰一*

Concurrency; Practice and Experience, 9(9), p.897 - 914, 1997/09

 被引用回数:0 パーセンタイル:0.02(Computer Science, Software Engineering)

広い仮想アドレス空間を持つ共有メモリ型並列計算機のための新しい領域確保法について述べる。共有メモリ型並列計算機を効率的に使用するためには、プロセッサを停止させることなく使用することが重要である。複数のプロセッサが同時にひとつの共有変数にアクセスすると、そのアクセスは逐次化される。つまり、頻繁な共有変数へのアクセスは、並列性を減少する。特に、動的領域確保を行う応用プログラムでは、共有変数であるアロケーションポイントへのアクセスが頻繁に行われる。本論文では、アロケーションポインタが広い仮想アドレス空間中を単調増加することにより、高速な領域確保を行う方法を示す。領域確保に伴うクリティカルセクションは、効率的なfetch-and-addプリミティブを使用することで、効率的に実行できる。応用プログラムは領域確保時にほとんど停止しないため、並列性は向上される。

論文

The Activities of center for promotion of computational science and engineering

浅井 清

Proc. of Joint Int. Conf. on Mathematical Methods and Supercomputing for Nuclear Applications, 1, p.3 - 16, 1997/00

本国際会議は、米国原子力学会(ANS)の数学的手法及び計算分部門(Div. Math. Method & Computation)とOECD/BEAの共催によって開催するもの。ANSは、2年に1回、NEAは3年に1回の開催で、NEAの国際会議SNA(Supercomputing in Nuclear Applications)は、原研が発案しNEAの強力のもとにシリーズ化を図ったものである。今回は、米、欧、アジア地域から各1名の招待講演者のひとりとして、この2年間の当センターの研究開発活動について講演する。その内容は、並列処理用基本ソフト、数値計算ライブラリ、可視化ソフト、格子生成ソフト、ベンチマークテスト用ソフトなどである。

論文

Development of Monte Carlo machine for particle transport problem

樋口 健二; 浅井 清; 秋元 正幸

Journal of Nuclear Science and Technology, 32(10), p.953 - 964, 1995/10

 被引用回数:1 パーセンタイル:17.20(Nuclear Science & Technology)

粒子輸送モンテカルロ・コードの高速処理を実現するため、モンテカルロ装置Monte-4を開発した。複雑な3次元空間における粒子の追跡計算は、スカラ命令や通常とは異なるベクトル命令を必要とするため、従来のスーパコンピュータ上での高速処理が困難であった。Monte-4は、モンテカルロ・パイプラインと呼ばれる特殊なハードウェアによってこれらの処理を高速化している。また、従来のベクトル計算機上で生じていた、データ転送能力と数値演算能力間の不均衡を解消するため、強化されたロード/ストアパイプラインを装備している。さらに、Monte-4は、4台のプロセッサによる並列処理によって高速化を実現している。汎用モンテカルロ・コードを用いた性能評価において、オリジナル・コードのスカラ処理に対し約10倍の速度向上率を達成した。

論文

Development of JAERI Monte Carlo machine and its effective performance

樋口 健二; 浅井 清; 秋元 正幸; 神林 奨; 徳田 伸二; 長谷川 幸弘*; 浅見 暁*; 佐々木 誠*

Comput. Assist. Mech. Eng. Sci., 1, p.191 - 204, 1994/00

粒子モデルを扱ったモンテカルロ計算等の数値シミュレーションの高速化を目指して開発されたモンテカルロ装置の設計思想、アークテクチャ及び性能評価結果について述べる。モンテカルロ装置の特長は、(1)数値演算に対するベクトル処理機能、(2)粒子分類を高速に行うための特殊パイプライン、(3)間接番地データ参照に関して強化されたロード/ストア・パイプライン及び(4)個々の粒子の振る舞いが独立であることを利用した並列処理機能にある。3つの粒子輸送モンテカルロ・コード、3次元相対論的プラズマ粒子シミュレーション・コード及び分子動力学シミュレーション・コードに対する装置の実効性能及び解析結果について述べる。

論文

並列計算機を利用した遮蔽安全評価用モンテカルロコードMCACEの高速化

川添 明美*; 南 多善*; 高野 誠; 増川 史洋; 内藤 俶孝

情報処理学会研究報告, 91(61), p.25 - 32, 1991/07

遮蔽安全評価用モンテカルロコードMCACEの並列化を行った。サンプル問題は「60Coガンマ-線源によるスカイシャイン問題」を使用した。これを高並列計算機AP1000のアーキテクチャ・ソフトウェア・シミュレータCASIMで計算時間の評価を行ったところ、400粒子8バッチを8セルで実行した場合、各セルの使用効率は、97.35%で1セルで実行した時の7.13倍計算時間が速くなった。さらに、実機AP1000での計算時間評価を行い、高速化度についても発表予定。

6 件中 1件目~6件目を表示
  • 1