検索対象:     
報告書番号:
※ 半角英数字
 年 ~ 
 年
検索結果: 23 件中 1件目~20件目を表示

発表形式

Initialising ...

選択項目を絞り込む

掲載資料名

Initialising ...

発表会議名

Initialising ...

筆頭著者名

Initialising ...

キーワード

Initialising ...

使用言語

Initialising ...

発行年

Initialising ...

開催年

Initialising ...

選択した検索結果をダウンロード

論文

Overlapping communications in gyrokinetic codes on accelerator-based platforms

朝比 祐一*; Latu, G.*; Bigot, J.*; 前山 伸也*; Grandgirard, V.*; 井戸村 泰宏

Concurrency and Computation; Practice and Experience, 32(5), p.e5551_1 - e5551_21, 2020/03

 被引用回数:0 パーセンタイル:100(Computer Science, Software Engineering)

2つのジャイロ運動論コード、GYSELA, GKVを最新のアクセラレータ環境、Xeon Phi KNL, Tesla P100 GPUに移植した。一台のSkylakeプロセッサーに比べ、KNLにおけるGYSELAの逐次計算カーネルは1.3x、P100 GPUにおけるGKVの逐次計算カーネルは7.4x高速化された。GYSELAとGKVのスケーリングテストをそれぞれ16-512 KNLおよび32-256 P100 GPUで実施し、GYSELAのセミラグランジアンカーネルおよびGKVの畳み込みカーネルにおけるデータ転置通信が主要なボトルネックとなることがわかった。この通信コストを削減するために、これらのコードにパイプライン法およびタスク並列法に基づく通信オーバーラップを実装した。

論文

Synergy of turbulent and neoclassical transport through poloidal convective cells

朝比 祐一*; Grandgirard, V.*; Sarazin, Y.*; Donnel, P.*; Garbet, X.*; 井戸村 泰宏; Dif-Pradalier, G.*; Latu, G.*

Plasma Physics and Controlled Fusion, 61(6), p.065015_1 - 065015_15, 2019/05

 被引用回数:0 パーセンタイル:100(Physics, Fluids & Plasmas)

Full-fジャイロ運動論コードGYSELAを用いて輸送過程へのポロイダル対流セルの影響を調べた。この目的のために、対流セルのフィルタを適用し、フィルタ有無のシミュレーション結果を比較した。フィルタを適用することで磁気ドリフトに駆動されるエネルギー束が半減することがわかった。対流セルの周波数スペクトは乱流レイノルズ応力テンソルの周波数と対応し、対流セルが乱流によって駆動されることを示した。この対流セルの効果は乱流と新古典のダイナミクスの相互作用と考えられる。

論文

Application of a communication-avoiding generalized minimal residual method to a gyrokinetic five dimensional Eulerian code on many core platforms

井戸村 泰宏; 伊奈 拓也*; 真弓 明恵; 山田 進; 松本 和也*; 朝比 祐一*; 今村 俊幸*

Proceedings of 8th Workshop on Latest Advances in Scalable Algorithms for Large-Scale Systems (ScalA 2017), p.7_1 - 7_8, 2017/11

ジャイロ運動論的5次元オイラーコードGT5Dに省通信一般化最小残差(CA-GMRES)法を適用し、一般化共役残差(GCR)法を用いたオリジナルコードとの性能比較をJAEA ICEX(Haswell)、Plasma Simulator(FX100)、Oakforest-PACS(KNL)において実施した。CA-GMRES法はGCR法に比べて約3.8倍の演算密度となることから、メモリとネットワークの帯域が制限された将来のエクサスケールアーキテクチャに適合する。性能評価の結果、GCR法に比べて計算カーネルは1.47$$sim$$2.39倍加速され、1,280ノード処理におけるデータ縮約通信は全体コストの5$$sim$$13%から約1%に削減された。

論文

Benchmarking of flux-driven full-F gyrokinetic simulations

朝比 祐一*; Grandgirard, V.*; 井戸村 泰宏; Garbet, X.*; Latu, G.*; Sarazin, Y.*; Dif-Pradalier, G.*; Donnel, P.*; Ehrlacher, C.*

Physics of Plasmas, 24(10), p.102515_1 - 102515_17, 2017/10

AA2017-0418.pdf:4.26MB

 被引用回数:1 パーセンタイル:89.16(Physics, Fluids & Plasmas)

トカマクプラズマにおける熱流駆動型のイオン温度勾配乱流を計算するために2つの大域的full-Fジャイロ運動論コードのベンチマークを行う。この目的のために、full-Fジャイロ運動論方程式を現実的な熱流束固定条件で計算するセミ・ラグランジアンコードGYSELA、および、オイラーコードGT5Dを採用する。時空間特性に注目して雪崩的な輸送現象を評価した。自己組織化臨界現象(SOC)的な振舞いを議論するために統計解析を実施し、両方のコードで高周波側で$$1/f$$スペクトルから$$1/f^3$$スペクトルへの遷移を確認した。このベンチマークに基づき、SOC的な振舞いは数値計算法に依存しないロバーストな特徴であることを検証した。

論文

Optimization of fusion kernels on accelerators with indirect or strided memory access patterns

朝比 祐一*; Latu, G.*; 伊奈 拓也; 井戸村 泰宏; Grandgirard, V.*; Garbet, X.*

IEEE Transactions on Parallel and Distributed Systems, 28(7), p.1974 - 1988, 2017/07

 被引用回数:4 パーセンタイル:39.58(Computer Science, Theory & Methods)

セミ・ラグランジュ法における間接メモリアクセス、有限差分法におけるストライドメモリアクセスといった複雑なメモリアクセスパターンを有する核融合プラズマ乱流コードの高次元ステンシル計算をGPGPUやXeon Phiプロセッサ等の演算加速器上で最適化した。どちらのデバイスでも、Array of Structure of Array (AOSOA)データレイアウトが連続的なメモリアクセスに有効である。Xeon Phiでは時空間データ局所性の向上によるローカルキャッシュの効率的利用が必要不可欠である。GPGPUではテクスチャメモリの利用がセミ・ラグランジュ法の間接メモリアクセス性能を向上する。これらの最適化により、アクセラレータ用核融合カーネルはCPU用カーネルに比べてSandy Bridge (CPU)用最適化コードに比べて1.4x - 8.1x高速化した。

論文

Computational challenges towards Exa-scale fusion plasma turbulence simulations

井戸村 泰宏; 朝比 祐一; 伊奈 拓也; 松岡 清吉

Proceedings of 24th International Congress of Theoretical and Applied Mechanics (ICTAM 2016), p.3106 - 3107, 2016/08

核融合プラズマにおける乱流輸送はITERにおける重要課題の一つである。この課題を5次元ジャイロ運動論モデルで研究するために新たな計算技術を開発し、ジャイロ運動論的トロイダル5次元オイラーコードGT5Dの強スケーリングを京コンピュータ上で約60万コアまで向上した。この計算技術は多次元/多階層領域分割、通信と計算のオーバーラップ、計算カーネルのマルチコアCPUへの最適化から構成される。この計算性能によって乱流輸送の装置サイズ依存性等のITERの重要課題の研究が可能になった。次世代の核燃焼プラズマ乱流シミュレーションに向けて、運動論的電子や多種イオンを含む物理モデルの拡張を進め、さらに最新のメニーコア環境で計算カーネルを最適化した。

口頭

The Influence of trapped electron mode driven zonal flow on electron temperature gradient driven turbulence

朝比 祐一; 石澤 明宏*; 渡邉 智彦*; 洲鎌 英雄*; 筒井 広明*; 飯尾 俊二*

no journal, , 

電子温度勾配(ETG)モードと捕捉電子モード(TEM)が共存する系における乱流輸送の特性をジャイロ運動論的シミュレーションによって調べた。これにより、ETG乱流がTEM駆動のゾーナルフローによって抑制されることを明らかにした。さらに、乱流抑制のメカニズムを調べるためにエントロピー移送の観点から解析を行った。これにより、捕捉電子モードからゾーナルフローへのエントロピー移送を確認した。同様に、定常状態において低い径方向波数のETGモードから高い径方向は数のETGモードへのゾーナルフローを介したエントロピーの移送を確認した。前者は、捕捉電子モードによってゾーナルフローが駆動されていることを示し、後者はTEM駆動のゾーナルフローによってETG乱流が抑制されていることを示す。

口頭

Optimization of fusion plasma codes

朝比 祐一; Latu, G.*; 伊奈 拓也; 井戸村 泰宏; Virginie, G.*; Garbet, X.*

no journal, , 

テラフロップス級のアーキテクチャにおいて、核融合プラズマコードのGYSELAとGT5Dの最適化を行った。対象としたアーキテクチャは、アクセラレータ(Xeon Phi、GPU)と最新型のマルチコアCPU (FX100)である。GYSELAカーネルはセミラグランジアンスキームを用いており、高い演算密度を有する。GYSELAカーネルのXeon Phi上での最適化を通じ、Xeon Phiにおいて有効なコードのベクトル化の重要性を示す。一方、GT5Dカーネルは差分法を用いており、複雑なメモリ読み込みの効率化が必要である。GT5DカーネルのGPU上での最適化を通じ、GPU上で有効なメモリアクセスの最適化手法を示す。

口頭

GPUにおける核融合プラズマ乱流コードの最適化

朝比 祐一; 井戸村 泰宏; 伊奈 拓也

no journal, , 

高温の核融合プラズマの特徴は無衝突性であり、速度空間に構造を持つ。そのため、核融合プラズマの閉じ込め性能劣化に繋がるプラズマ乱流の解析においては、通常の3次元流体モデルではなく、5次元の運動論的モデルが用いられる。本講演では、差分法に基づく核融合プラズマ乱流コードGT5DのGPU化を通じ、高次元のステンシル計算における最適化手法について論じる。

口頭

Optimization of stencil-based fusion kernels on Tera-flops many-core architectures

朝比 祐一; Latu, G.*; 伊奈 拓也; 井戸村 泰宏; Grandgirard, V.*; Garbet, X.*

no journal, , 

テラフロップス級のメニーコアアーキテクチャにおいて、核融合プラズマコード、GYSELA、GT5Dのカーネル最適化を行った。本研究で用いたアーキテクチャは、アクセラレータ(Xeon Phi、GPU)と最新型のマルチコアCPU (FX100)である。GYSELAカーネルは、セミラグランジアンスキームを用いており、高い演算密度を有する。GYSELAカーネルのXeon Phi上での最適化を通じ、Xeon Phiにおいて有効なコードのベクトル化の重要性を示す。一方、GT5Dカーネルは差分法に用いており、複雑なメモリ読み込みの効率化が欠かせない。GT5DカーネルのGPU上での最適化を通じ、GPU上で有効なshared memoryを用いたメモリアクセスの効率化手法を示す。

口頭

テラフロップス級メニーコアアーキテクチャにおけるステンシル計算の最適化手法の開発

伊奈 拓也; 朝比 祐一; 井戸村 泰宏

no journal, , 

核融合分野で研究されているプラズマ乱流シミュレーションには多大な計算資源が必要となる。特に、国際熱核融合実験炉ITER規模のシミュレーションを実行するためには将来のエクサスケールマシンが必要不可欠である。エクサスケールマシンのアーキテクチャは未定であるが、現存するアーキテクチャがベースになると考えられる。本研究の目的はテラフロップス級の演算性能を持つアーキテクチャであるXeon phi, GPU, FX100に対するステンシル計算の最適化手法を確立することである。Xeon phiに対しては多重ループの一重化およびスレッド間の動的スケジューリング。GPUに対してはwarp divergenceの回避およびレジスタの再利用。FX100に対してはチャンクサイズの調整によるL2キャッシュの再利用とL1キャッシュに対するソフトウェアプリフェチの促進。Xeon phi, GPU, FX100に対して最適化を施すことで性能が向上した。Xeon phi, GPU, FX100についてステンシル計算の効果的な最適化手法を確認した。

口頭

電子熱輸送および粒子輸送における非捕捉電子の影響

朝比 祐一; 井戸村 泰宏; 前山 伸也*; 仲田 資季*; 石澤 明宏*; 渡邉 智彦*

no journal, , 

従来の局所的乱流輸送シミュレーションにおいて、イオン温度勾配乱流などイオンスケールの乱流を扱う場合、電子は断熱的に振る舞うと仮定されてきた。特に、非捕捉電子は磁力線平行方向への素早い運動から断熱的に応答するとされる。しかしながら、近年の研究により、低次のモード共鳴面近傍においては非捕捉電子に対しても非断熱的応答つまり運動論的効果が重要となり、電子熱輸送、粒子輸送への寄与が無視できないことが指摘されている。発表では、複数の運動論的電子モデルを採用した局所的乱流輸送シミュレーションの比較を通じて、非捕捉電子の熱輸送および粒子輸送への影響について論じる。

口頭

Full-fジャイロ運動論的シミュレーションのコード間ベンチマーク

朝比 祐一; 井戸村 泰宏; 伊奈 拓也; Garbet, X.*; Grandgirard, V.*; Latu, G.*

no journal, , 

Delta-fジャイロ運動論的シミュレーションと呼ばれる従来のプラズマ乱流シミュレーションでは、背景のプラズマと揺動のプラズマのスケール分離が仮定され揺動のプラズマの時間発展のみが計算された。これに対し、Full-fジャイロ運動論的シミュレーションでは、背景のプラズマと揺動のプラズマを第一原理的に同時に発展させるため、従来扱えなかった自己無頓着なプラズマ分布と乱流の相互作用という物理を扱うことができる。Delta-fジャイロ運動論的シミュレーションコードは多数存在し、コード間ベンチマークは盛んに行われてきた。それによって計算自体のロバスト性が確保されているが、Full-fシミュレーションにおいては、物理的複雑さゆえ、系統的なベンチマークは行われていない。発表では、機構および外部機関において独立に開発されたFull-fジャイロ運動論的シミュレーションコード間のベンチマークの進展状況および課題について論じる。

口頭

核融合シミュレーションコードのGPUクラスタにおける高性能実装

松本 和也; 朝比 祐一*; 伊奈 拓也; 井戸村 泰宏

no journal, , 

核融合プラズマ流体解析コードGT5Dの主要計算カーネルをGPUクラスタにおいて実装し、性能評価を行った結果を述べる。本研究ではコード内で性能ボトルネックとなっている反復法行列ソルバに対してGPU上でのチューニングを行い、実測性能とルーフラインモデルにより算出した達成可能な実効性能との比較をする。また、複数GPUを使用するためにGPU間直接通信技術を用いた実装についても述べる。

口頭

Full-f gyrokinetic simulation including kinetic electrons

井戸村 泰宏; 朝比 祐一*; 林 伸彦*; 浦野 創*

no journal, , 

Full-fジャイロ運動論シミュレーションは核融合プラズマにおける非局所的乱流輸送現象、プラズマ分布、閉じ込め時間を解析する上で重要なツールであるが、従来のFull-fシュミュレーションは断熱応答電子を仮定するイオン系乱流しか扱えなかった。ITERで重要となる電子系乱流を解析するために、本研究ではFull-fシミュレーションの新たなハイブリッド電子モデルを開発し、その精度検証を実施した。このモデルでは、乱流場を決定するポアソン方程式において高周波ノイズを励起する通過電子応答を解析解で近似することによって高周波ノイズを消去し、長時間スケールのFull-fシミュレーションを実現した。このモデルを用いた電子系乱流の数値実験により、電子乱流輸送に関連する新たな乱流抑制機構や運動量輸送機構を発見した。また、実証研究において実験的に観測されている電子加熱がもたらすプラズマ回転変化を再現できることを示した。

口頭

Benchmarking of global full-f gyrokinetic codes

朝比 祐一*; Garbet, X.*; 井戸村 泰宏; Grandgirard, V.*; Latu, G.*; Sarazin, Y.*; Dif-Pradalier, G.*; Donnel, P.*; Ehrlacher, C.*; Passeron, Ch.*

no journal, , 

CEAおよび原子力機構で開発した2つの大域的full-fジャイロ運動論コードのベンチマークを実施した。イオン温度勾配駆動モードの線形安定性、帯状流の線形減衰、衝突性輸送といった線形過程については2つのコード間の定量的一致を確認した。非線形乱流シミュレーションの予備的なベンチマークでは境界条件や熱源モデル等の計算モデルの違いに起因する計算結果の違いを確認し、今後の定量的な非線形ベンチマークに向けた課題を明らかにした。

口頭

Acceleration of stencil-based fusion kernels

朝比 祐一*; Latu, G.*; 伊奈 拓也; 井戸村 泰宏; Grandgirard, V.*; Garbet, X.*

no journal, , 

セミ・ラグランジュ法, 有限差分法といったステンシル計算に基づく核融合プラズマ乱流コードの計算カーネルをGPUGPU, Xeon Phi, FX100といった最新メニーコアプロセッサ上で最適化し、1.4x - 8.1xの処理性能向上を達成した。数値計算法によって異なるメモリアクセスパターンと各ハードウェアのメモリ-キャッシュ機構の親和性を確認し、各環境で異なる最適化技術を開発した。XeonPhiではスレッド間のロードバランスを向上し、ローカルキャッシュ有効利用のための最適化技術を開発した。GPGPUではテクスチャメモリを活用した最適化技術やレジスタを再利用する実装を開発した。一方、FX100では従来のCPU向け最適化をそのまま利用できることがわかった。

口頭

BMTFFの研究成果

朝比 祐一*; Grandgirard, V.*; 井戸村 泰宏; Sarazin, Y.*; Latu, G.*; Garbet, X.*

no journal, , 

本講演では、平成27年度-28年度に実施したBMTFFプロジェクトの研究成果を概説する。本プロジェクトでは、full-fジャイロ運動論モデルのしっかりした基盤を確立するために、EUと日本の2つの主要full-fジャイロ運動論コード、GYSELAおよびGT5Dのベンチマークを実施した。平成27年度には全ての数値的実装の検証を行い、境界条件が同じになるようにコードを修正した。この修正により、衝突性輸送、線形帯状流減衰、イオン温度勾配駆動(ITG)モードの線形安定性のベンチマークに成功した。平成28年度は両方のコードに同じソースとシンクのモデルを実装し、非線形乱流計算のベンチマークを実施した。熱源のない減衰ITG乱流計算は同様の分布緩和過程を示し、非線形臨界温度勾配が互いに定量的に一致することを確認した。一方、熱源を含む駆動ITG乱流計算は雪崩的輸送の間欠的バーストを示し、同様の1/fタイプの周波数スペクトルを確認した。

口頭

Performance evaluation of a modified communication-avoiding generalized minimal residual method on many core platforms

井戸村 泰宏; 伊奈 拓也*; 真弓 明恵; 山田 進; 松本 和也*; 朝比 祐一*; 今村 俊幸*

no journal, , 

本研究ではオリジナルの省通信一般化最小残差(CA-GMRES)法と同じ省通信特性を維持しつつ計算量とメモリーアクセスを30%削減する修正CA-GMRES法を提案する。より高い演算密度、かつ、より少ない通信量と計算量という演算特性はメモリ帯域幅と通信帯域幅が制限される将来のエクサスケール計算機に対して有望な特徴である。修正CA-GMRES法をジャイロ運動論的トロイダル5次元オイラーコードGT5Dの陰解法ソルバにおける大規模非対称行列に適用し、Oakforest-PACS(KNL)において性能評価を行った。数値実験結果から、一般化共役残差法と比べて、演算カーネルは1.5倍高速化され、1,280ノード利用時のデータ縮約通信コストは全体コストの12.5%から1%に削減されることが示された。

口頭

Development of exascale fusion plasma turbulence simulations for post-K

井戸村 泰宏; 伊奈 拓也*; Obrejan, K.; 朝比 祐一*; 松岡 清吉*; 今村 俊幸*

no journal, , 

ポスト京重点課題において、メニーコアプロセッサに基づく次世代計算環境向けにジャイロ運動論的トロイダル5次元オイラーコードGT5Dの計算技術開発を進めてきた。本発表では、複雑なプロセッサ内メモリ階層、および、演算加速に比べて限定的なノード間通信性能に関する計算技術の課題を議論する。前者に関しては、各メニーコアアーキテクチャ上でステンシル計算カーネルのデータアクセスパターンを最適化し、高い性能向上を達成した。後者に関しては、先進的な省通信クリロフ部分空間法を適用した。この手法は集団通信を一桁以上削減し、さらに主要な計算カーネルの演算密度を向上する。上記の新たな計算技術の適用により、最新メニーコア環境におけるGT5Dの性能が大幅に向上し、Oakforest-PACS全系(8,192KNL)までの良好な強スケーリングを達成した。

23 件中 1件目~20件目を表示