検索対象:     
報告書番号:
※ 半角英数字
 年 ~ 
 年
検索結果: 4 件中 1件目~4件目を表示
  • 1

発表形式

Initialising ...

選択項目を絞り込む

掲載資料名

Initialising ...

発表会議名

Initialising ...

筆頭著者名

Initialising ...

キーワード

Initialising ...

使用言語

Initialising ...

発行年

Initialising ...

開催年

Initialising ...

選択した検索結果をダウンロード

論文

Nuclear fusion simulation code optimization and performance evaluation on GPU cluster

藤田 典久*; 奴賀 秀男*; 朴 泰祐*; 井戸村 泰宏

Proceedings of 2014 IEEE 28th International Parallel & Distributed Processing Symposium Workshops (Internet), p.1266 - 1274, 2014/12

 被引用回数:1 パーセンタイル:29.91(Computer Science, Theory & Methods)

GT5Dはトカマクプラズマにおける乱流現象の解析を目的とする核融合シミュレーションプログラムである。本研究ではこれをノードあたり複数GPUを搭載したGPUクラスタに対して最適化した。CPUノード上のGT5Dの特性評価に基づき、MPI通信以外のプログラムの時間発展部分全体をGPUに移植した。NVIDIA M2090 GPU4台を用いて、8コアを搭載したIntel Xeon E5-2670(SandyBridge)CPU2台に比べて、関数レベルで最大3.35倍、全体で1.91倍高速な処理性能が得られた。ここで、MPI処理とGPU計算をオーバーラップすることによって63%の性能向上が得られた。

論文

Nuclear fusion simulation code optimization on GPU clusters

藤田 典久*; 奴賀 秀男*; 朴 泰祐*; 井戸村 泰宏

Proceedings of 19th IEEE International Conference on Parallel and Distributed Systems (ICPDCS 2013) (USB Flash Drive), 2 Pages, 2013/12

A fusion plasma turbulence simulation code GT5D is optimized for GPU clusters with multiple GPUs on a node. We get 3.37 times faster performance in maximum in function level evaluation, and 2.03 times faster performance in total than the case of CPU-only execution on the HA-PACS GPU cluster. It includes 53% performance gain with overlapping MPI communications and GPU calculations.

口頭

GPUクラスタにおける核融合シミュレーションコードの実装

藤田 典久*; 奴賀 秀男*; 井戸村 泰宏; 朴 泰祐*

no journal, , 

核融合プラズマシミュレーションコードGT5Dを大規模GPUクラスタに移植し、その性能評価を実施した。ノードあたり4GPUを搭載する筑波大学のHA-PACSシステムにおいて主要カーネルをGPUメモリ上へ移植し、GPU間の通信処理を演算処理とオーバーラップする通信マスク手法を開発した。移植した主要カーネルの処理性能としてはCPUに比べて平均2.3倍程度の高速化を達成したが、コード全体としては処理時間比率で7割程度のカーネルしか移植が完了していないため、1.3倍程度の高速化に留まった。しかしながら、通信マスク手法を適用することにより、1.85倍まで性能を改善することに成功した。

口頭

GPUクラスタHA-PACSにおける核融合シミュレーションコードの性能評価

藤田 典久*; 奴賀 秀男*; 朴 泰祐*; 井戸村 泰宏

no journal, , 

1ノードに複数のGPUを搭載したGPUクラスタシステムに対して核融合プラズマ乱流シミュレーションコードGT5Dの最適化を行った。全ての計算ループをGPU上に移植し、主要なMPI通信に通信オーバラップ手法を適用した。HA-PACSシステム上で、CPUのみの計算に比べてGPU-CPU計算で2.03倍の高速化を達成した。

4 件中 1件目~4件目を表示
  • 1