検索対象:     
報告書番号:
※ 半角英数字
 年 ~ 
 年
検索結果: 32 件中 1件目~20件目を表示

発表形式

Initialising ...

選択項目を絞り込む

掲載資料名

Initialising ...

発表会議名

Initialising ...

筆頭著者名

Initialising ...

キーワード

Initialising ...

使用言語

Initialising ...

発行年

Initialising ...

開催年

Initialising ...

選択した検索結果をダウンロード

論文

Communication avoiding multigrid preconditioned conjugate gradient method for extreme scale multiphase CFD simulations

井戸村 泰宏; 伊奈 拓也*; 山下 晋; 小野寺 直幸; 山田 進; 今村 俊幸*

Proceedings of 9th Workshop on Latest Advances in Scalable Algorithms for Large-Scale Systems (ScalA 2018) (Internet), p.17 - 24, 2018/11

多相流体CFDコードJUPITERの圧力ポアソン方程式に省通信マルチグリッド前処理付共役勾配(CAMGCG)法を適用し、省通信クリロフ部分空間法と計算性能と収束特性を比較した。JUPITERコードにおいてCAMGCGソルバ問題サイズによらずロバーストな収束特性を有し、通信削減と収束特性向上を両立することから、通信削減のみを実現する省通信クリロフ部分空間法に対する優位性が高い。CAMGCGソルバを$$sim 900$$億自由度の大規模多相流体CFDシミュレーションに適用して反復回数を前処理付CG法の$$sim 1/800$$に削減し、Oakforest-PACSにおける8,000ノードまでの良好な強スケーリングとCG法の$$sim 11.6$$倍の性能向上を達成した。

論文

Application of a preconditioned Chebyshev basis communication-avoiding conjugate gradient method to a multiphase thermal-hydraulic CFD code

井戸村 泰宏; 伊奈 拓也*; 真弓 明恵; 山田 進; 今村 俊幸*

Lecture Notes in Computer Science 10776, p.257 - 273, 2018/00

前処理付チェビシェフ基底省通信共役勾配(P-CBCG)法を多相熱流体CFDコードJUPITERにおける圧力ポアソン方程式に適用し、8,208台のKNLプロセッサを搭載したOakforest-PACS上で計算性能と収束特性を前処理付共役勾配(P-CG)法や前処理付省通信共役勾配(P-CACG)法と比較した。P-CBCG法は収束特性のロバースト性を維持しつつ集団通信回数を削減する。このロバースト性向上により、P-CACG法と比べて一桁以上大きい省通信ステップ数を実現する。2,000プロセッサを用いた場合、P-CBCG法はP-CG法, P-CACG法と比べてそれぞれ1.38倍, 1.17倍高速であることを示した。

論文

原子炉過酷事故時における炉内溶融物移行挙動の大規模数値シミュレーション

山下 晋; 伊奈 拓也*; 井戸村 泰宏; 吉田 啓之

第31回数値流体力学シンポジウム講演論文集(DVD-ROM), 7 Pages, 2017/12

原子力機構では、過酷事故時の炉内溶融物移行挙動進展を現象論的に評価するために、数値流体力学的手法に基づく3次元多相多成分熱流動解析手法(JUPITER)の開発を行っている。原子炉過酷事故では、燃料棒1本スケール(数cm)から圧力容器スケール(十数メートル)まで非常に広範囲に渡るマルチスケール・マルチフィジクス現象を含むため、溶融物の移行挙動の詳細な予測のためには、高性能な大規模計算が必要不可欠となる。このような問題を解決するため、大規模並列計算に適した計算スキームの適用だけでなく、計算負荷の多くを占める圧力Poissonソルバーに対する反復解法を超並列計算に適したソルバーを適用した。これら手法を用いて、原子炉過酷事故時の炉内状況予測に向けた溶融物移行挙動解析手法の有効性評価と大規模計算への対応のため、実験解析及び予備解析を実施し、妥当性並びに大規模計算における良好な並列性能を有することを確認した。

論文

Application of a communication-avoiding generalized minimal residual method to a gyrokinetic five dimensional Eulerian code on many core platforms

井戸村 泰宏; 伊奈 拓也*; 真弓 明恵; 山田 進; 松本 和也*; 朝比 祐一*; 今村 俊幸*

Proceedings of 8th Workshop on Latest Advances in Scalable Algorithms for Large-Scale Systems (ScalA 2017), p.7_1 - 7_8, 2017/11

ジャイロ運動論的5次元オイラーコードGT5Dに省通信一般化最小残差(CA-GMRES)法を適用し、一般化共役残差(GCR)法を用いたオリジナルコードとの性能比較をJAEA ICEX(Haswell)、Plasma Simulator(FX100)、Oakforest-PACS(KNL)において実施した。CA-GMRES法はGCR法に比べて約3.8倍の演算密度となることから、メモリとネットワークの帯域が制限された将来のエクサスケールアーキテクチャに適合する。性能評価の結果、GCR法に比べて計算カーネルは1.47$$sim$$2.39倍加速され、1,280ノード処理におけるデータ縮約通信は全体コストの5$$sim$$13%から約1%に削減された。

論文

A Numerical simulation method for molten material behavior in nuclear reactors

山下 晋; 伊奈 拓也; 井戸村 泰宏; 吉田 啓之

Nuclear Engineering and Design, 322, p.301 - 312, 2017/10

 被引用回数:4 パーセンタイル:18.09(Nuclear Science & Technology)

過酷事故時の沸騰水型原子炉における溶融物の詳細な挙動について大きな注目を集めている。この挙動を明らかにするために、原子力機構では3次元多相多成分熱流動解析コードJUPITERを開発している。本論文では、JUPITERの妥当性を確認するために計算手法の基礎的妥当性検証及び実験結果との比較を実施し、良好な一致を得ることができた。加えて新たに開発したハイブリッド並列Poissonソルバーを導入することによって劇的に性能が向上した。そして、スーパーコンピュータ「京」において20万コアまでのストロングスケーリングを達成した。これらJUPITERの物理的、計算機的能力は、過酷事故時の各種溶融現象の評価を可能にするものと言える。

論文

Quadruple-precision BLAS using Bailey's arithmetic with FMA instruction; Its performance and applications

山田 進; 伊奈 拓也*; 佐々 成正; 井戸村 泰宏; 町田 昌彦; 今村 俊幸*

Proceedings of 2017 IEEE International Parallel & Distributed Processing Symposium Workshops (IPDPSW) (Internet), p.1418 - 1425, 2017/08

本発表では、BaileyのDouble-Doubleアルゴリズムを利用した4倍精度基本線形代数演算ライブラリ「BLAS」の高速化と、それを4倍精度固有値計算ルーチンに適用した際の計算性能の向上について発表する。特筆すべき成果は、積和演算の中間結果を高精度で保持して計算できるFMA命令を利用することで、我々がこれまでに開発した4倍精度BLASと比較し、代表的なルーチンで20$$sim$$45%の高速化を実現したことである。さらに、4倍精度固有値ソルバ「QPEigenK」が利用している4倍精度BLASをFMA命令を利用して開発したものに置き換えるだけで、原子力機構のICE Xおよび東京大学のFX10の2つのスパコンの大規模並列計算において10$$sim$$20%の高速化を実現した。この成果は、計算機の大規模化に伴って必要になりつつある高精度計算の高速な実行に資する成果である。

論文

Optimization of fusion kernels on accelerators with indirect or strided memory access patterns

朝比 祐一*; Latu, G.*; 伊奈 拓也; 井戸村 泰宏; Grandgirard, V.*; Garbet, X.*

IEEE Transactions on Parallel and Distributed Systems, 28(7), p.1974 - 1988, 2017/07

 被引用回数:1 パーセンタイル:60.51(Computer Science, Theory & Methods)

セミ・ラグランジュ法における間接メモリアクセス、有限差分法におけるストライドメモリアクセスといった複雑なメモリアクセスパターンを有する核融合プラズマ乱流コードの高次元ステンシル計算をGPGPUやXeon Phiプロセッサ等の演算加速器上で最適化した。どちらのデバイスでも、Array of Structure of Array (AOSOA)データレイアウトが連続的なメモリアクセスに有効である。Xeon Phiでは時空間データ局所性の向上によるローカルキャッシュの効率的利用が必要不可欠である。GPGPUではテクスチャメモリの利用がセミ・ラグランジュ法の間接メモリアクセス性能を向上する。これらの最適化により、アクセラレータ用核融合カーネルはCPU用カーネルに比べてSandy Bridge (CPU)用最適化コードに比べて1.4x - 8.1x高速化した。

論文

Left-preconditioned communication-avoiding conjugate gradient methods for multiphase CFD simulations on the K computer

真弓 明恵; 井戸村 泰宏; 伊奈 拓也; 山田 進; 今村 俊幸*

Proceedings of 7th Workshop on Latest Advances in Scalable Algorithms for Large-Scale Systems (ScalA 2016) (Internet), p.17 - 24, 2016/11

左前処理省通信共役勾配(LP-CA-CG)法を多相数値流体力学コードJUPITERの圧力Poisson方程式に適用した。LP-CA-CG法の演算密度を分析し、内積処理と三項間漸化式処理のループ分割を行うことで演算密度を大きく向上した。ブロックヤコビ前処理及びアンダーラップ前処理を適用した2つのLP-CA-CGソルバを開発した。京コンピュータ上では局所的な1対1通信のスケールが良好であることと、アンダーラップ前処理を適用すると収束性が悪くなることにより、ブロックヤコビ前処理ソルバにより良好な性能が得られた。このソルバは3万ノードまで良好な強スケーリングを示し、大域的集団通信のコストを69%削減することにより従来のCG法ソルバに比べて高い性能を達成した。

論文

Computational challenges towards Exa-scale fusion plasma turbulence simulations

井戸村 泰宏; 朝比 祐一; 伊奈 拓也; 松岡 清吉

Proceedings of 24th International Congress of Theoretical and Applied Mechanics (ICTAM 2016), p.3106 - 3107, 2016/08

核融合プラズマにおける乱流輸送はITERにおける重要課題の一つである。この課題を5次元ジャイロ運動論モデルで研究するために新たな計算技術を開発し、ジャイロ運動論的トロイダル5次元オイラーコードGT5Dの強スケーリングを京コンピュータ上で約60万コアまで向上した。この計算技術は多次元/多階層領域分割、通信と計算のオーバーラップ、計算カーネルのマルチコアCPUへの最適化から構成される。この計算性能によって乱流輸送の装置サイズ依存性等のITERの重要課題の研究が可能になった。次世代の核燃焼プラズマ乱流シミュレーションに向けて、運動論的電子や多種イオンを含む物理モデルの拡張を進め、さらに最新のメニーコア環境で計算カーネルを最適化した。

口頭

福島第一原発事故における拡散シミュレーション

永井 晴康; 堅田 元喜; 太田 雅和; 伊奈 拓也; 掛札 豊和; 遠藤 章

no journal, , 

東京電力福島第一原子力発電所の事故に伴い、環境中に放出された放射性物質による福島県等の住民の健康リスク評価を行うための基礎データとして、住民の被ばく線量の把握は重要である。このうち、ヨウ素等の短半減期核種による事故初期段階における内部被ばく線量については、現時点では実測に基づく評価が困難であり、大気拡散シミュレーションにより得られる時系列大気中放射性物質濃度マップと行動パターンを組合せた推計が現実的である。原子力機構では、原子力緊急時対応システムとして開発したWSPEEDI-IIを適用して、事故により放出された放射性物質の環境中移行の詳細解析を進めている。ここでは、線量推計に必要となる、大気中放射性物質濃度の時空間分布データベースを、大気拡散シミュレーションにより構築することを目的として行った解析について報告する。

口頭

Reconstruction of the spatiotemporal distribution of radioactive materials discharged from the Fukushima Dai-ichi Nuclear Power Plant by atmospheric dispersion simulations

永井 晴康; 堅田 元喜; 太田 雅和; 伊奈 拓也; 掛札 豊和; 遠藤 章

no journal, , 

東京電力福島第一原子力発電所の事故に伴い、環境中に放出された放射性物質による福島県等の住民の健康リスク評価を行うための基礎データとして、住民の被ばく線量の把握は重要である。このうち、ヨウ素等の短半減期核種による事故初期段階における内部被ばく線量については、現時点では実測に基づく評価が困難であり、大気拡散シミュレーションにより得られる時系列大気中放射性物質濃度マップと行動パターンを組合せた推計が現実的である。原子力機構では、原子力緊急時対応システムWSPEEDI-IIを適用して、事故により放出された放射性物質の環境中移行の詳細解析を進めている。ここでは、線量推計に必要となる、大気中放射性物質濃度の時空間分布データベースを、大気拡散シミュレーションにより構築することを目的として行った解析について報告する。

口頭

Optimization of fusion plasma codes

朝比 祐一; Latu, G.*; 伊奈 拓也; 井戸村 泰宏; Virginie, G.*; Garbet, X.*

no journal, , 

テラフロップス級のアーキテクチャにおいて、核融合プラズマコードのGYSELAとGT5Dの最適化を行った。対象としたアーキテクチャは、アクセラレータ(Xeon Phi、GPU)と最新型のマルチコアCPU (FX100)である。GYSELAカーネルはセミラグランジアンスキームを用いており、高い演算密度を有する。GYSELAカーネルのXeon Phi上での最適化を通じ、Xeon Phiにおいて有効なコードのベクトル化の重要性を示す。一方、GT5Dカーネルは差分法を用いており、複雑なメモリ読み込みの効率化が必要である。GT5DカーネルのGPU上での最適化を通じ、GPU上で有効なメモリアクセスの最適化手法を示す。

口頭

GPUにおける核融合プラズマ乱流コードの最適化

朝比 祐一; 井戸村 泰宏; 伊奈 拓也

no journal, , 

高温の核融合プラズマの特徴は無衝突性であり、速度空間に構造を持つ。そのため、核融合プラズマの閉じ込め性能劣化に繋がるプラズマ乱流の解析においては、通常の3次元流体モデルではなく、5次元の運動論的モデルが用いられる。本講演では、差分法に基づく核融合プラズマ乱流コードGT5DのGPU化を通じ、高次元のステンシル計算における最適化手法について論じる。

口頭

Optimization of stencil-based fusion kernels on Tera-flops many-core architectures

朝比 祐一; Latu, G.*; 伊奈 拓也; 井戸村 泰宏; Grandgirard, V.*; Garbet, X.*

no journal, , 

テラフロップス級のメニーコアアーキテクチャにおいて、核融合プラズマコード、GYSELA、GT5Dのカーネル最適化を行った。本研究で用いたアーキテクチャは、アクセラレータ(Xeon Phi、GPU)と最新型のマルチコアCPU (FX100)である。GYSELAカーネルは、セミラグランジアンスキームを用いており、高い演算密度を有する。GYSELAカーネルのXeon Phi上での最適化を通じ、Xeon Phiにおいて有効なコードのベクトル化の重要性を示す。一方、GT5Dカーネルは差分法に用いており、複雑なメモリ読み込みの効率化が欠かせない。GT5DカーネルのGPU上での最適化を通じ、GPU上で有効なshared memoryを用いたメモリアクセスの効率化手法を示す。

口頭

テラフロップス級メニーコアアーキテクチャにおけるステンシル計算の最適化手法の開発

伊奈 拓也; 朝比 祐一; 井戸村 泰宏

no journal, , 

核融合分野で研究されているプラズマ乱流シミュレーションには多大な計算資源が必要となる。特に、国際熱核融合実験炉ITER規模のシミュレーションを実行するためには将来のエクサスケールマシンが必要不可欠である。エクサスケールマシンのアーキテクチャは未定であるが、現存するアーキテクチャがベースになると考えられる。本研究の目的はテラフロップス級の演算性能を持つアーキテクチャであるXeon phi, GPU, FX100に対するステンシル計算の最適化手法を確立することである。Xeon phiに対しては多重ループの一重化およびスレッド間の動的スケジューリング。GPUに対してはwarp divergenceの回避およびレジスタの再利用。FX100に対してはチャンクサイズの調整によるL2キャッシュの再利用とL1キャッシュに対するソフトウェアプリフェチの促進。Xeon phi, GPU, FX100に対して最適化を施すことで性能が向上した。Xeon phi, GPU, FX100についてステンシル計算の効果的な最適化手法を確認した。

口頭

Full-fジャイロ運動論的シミュレーションのコード間ベンチマーク

朝比 祐一; 井戸村 泰宏; 伊奈 拓也; Garbet, X.*; Grandgirard, V.*; Latu, G.*

no journal, , 

Delta-fジャイロ運動論的シミュレーションと呼ばれる従来のプラズマ乱流シミュレーションでは、背景のプラズマと揺動のプラズマのスケール分離が仮定され揺動のプラズマの時間発展のみが計算された。これに対し、Full-fジャイロ運動論的シミュレーションでは、背景のプラズマと揺動のプラズマを第一原理的に同時に発展させるため、従来扱えなかった自己無頓着なプラズマ分布と乱流の相互作用という物理を扱うことができる。Delta-fジャイロ運動論的シミュレーションコードは多数存在し、コード間ベンチマークは盛んに行われてきた。それによって計算自体のロバスト性が確保されているが、Full-fシミュレーションにおいては、物理的複雑さゆえ、系統的なベンチマークは行われていない。発表では、機構および外部機関において独立に開発されたFull-fジャイロ運動論的シミュレーションコード間のベンチマークの進展状況および課題について論じる。

口頭

多相流体問題への省通信GMRES法の適用性評価

真弓 明恵; 井戸村 泰宏; 山田 進; 伊奈 拓也; 山下 晋

no journal, , 

日本原子力研究開発機構では東京電力福島第一原子力発電所事故で溶融した燃料の挙動を解析するために、多相多成分熱流動解析コードJUPITERの開発を進めている。現状の計算規模では炉内構造物単体の燃料溶融シミュレーションは可能であるが、炉心全体のシミュレーションを実行するためにはエクサスケールマシンが必要となる。非圧縮流体モデルに基づくJUPITERコードでは圧力のPoisson方程式の反復法ソルバが主要な計算コストを占めるが、スケーラビリティを向上する上でデータ通信コストがボトルネックとなるため、ソルバの省通信化が重要な課題である。本研究ではこのデータ通信コストを削減するアルゴリズムとして省通信GMRESを実装し、実問題における収束特性を調査することで、その有用性を評価する。

口頭

圧縮対角格納形式の適用による多相流体コードの高速化

伊奈 拓也; 井戸村 泰宏; 山田 進; 真弓 明恵; 山下 晋

no journal, , 

日本原子力研究開発機構が開発を進めている多相多成分熱流動解析コードJUPITERは差分法で離散化した連立方程式の反復法ソルバとして数値計算ライブラリPETScを使用している。数値計算ライブラリPETScの疎行列格納形式として圧縮行格納(CSR)形式を採用している。しかし、差分法を適用して得られる連立方程式の係数行列は対角と副対角にのみ要素を持つ規則的な疎行列であるため、CSR形式より対角行列専用の格納形式である圧縮対角格納(DIA)形式を利用することで効率的に計算することが可能である。反復法ソルバの高速化を行うためにDIA形式に対応した共役勾配法の開発を行いJUPITERコードの高速化とメモリ使用量の削減を実現した。

口頭

核融合シミュレーションコードのGPUクラスタにおける高性能実装

松本 和也; 朝比 祐一*; 伊奈 拓也; 井戸村 泰宏

no journal, , 

核融合プラズマ流体解析コードGT5Dの主要計算カーネルをGPUクラスタにおいて実装し、性能評価を行った結果を述べる。本研究ではコード内で性能ボトルネックとなっている反復法行列ソルバに対してGPU上でのチューニングを行い、実測性能とルーフラインモデルにより算出した達成可能な実効性能との比較をする。また、複数GPUを使用するためにGPU間直接通信技術を用いた実装についても述べる。

口頭

多相流体問題における省通信Krylov部分空間法の性能評価

真弓 明恵; 井戸村 泰宏; 山田 進; 伊奈 拓也; 山下 晋

no journal, , 

多相多成分熱流動解析コードJUPITERのPoissonソルバに省通信CG法を実装し、実問題における収束特性と処理性能を調査した。省通信化に伴う数値誤差の蓄積による収束特性悪化の問題を分析し、アルゴリズムを部分的に4倍精度化して収束特性を向上する手法を考案した。

32 件中 1件目~20件目を表示