検索対象:     
報告書番号:
※ 半角英数字
 年 ~ 
 年
検索結果: 54 件中 1件目~20件目を表示

発表形式

Initialising ...

選択項目を絞り込む

掲載資料名

Initialising ...

発表会議名

Initialising ...

筆頭著者名

Initialising ...

キーワード

Initialising ...

使用言語

Initialising ...

発行年

Initialising ...

開催年

Initialising ...

選択した検索結果をダウンロード

論文

C++ parallel algorithmによる性能可搬性評価

朝比 祐一; Padioleau, T.*; Latu, G.*; Bigot, J.*; Grandgirard, V.*; Obrejan, K.*

第36回数値流体力学シンポジウム講演論文集(インターネット), 8 Pages, 2022/12

本論文では、運動論的プラズマシミュレーションコードを例としてC++ parallel algorithm (stdpar)による性能可搬実装について論じる。言語標準の並列アルゴリズムstdparと抽象的高次元配列mdspanにより、可読性および生産性を損なわずに性能可搬な実装が可能であることを示す。抽象化により性能可搬性を実現するKokkosや、指示行によって性能可搬性を実現するOpenMPとの比較により、stdparの性能,可搬性,生産性などを論じる。Intel Icelake, NVIDIA V100およびA100 GPUにおいて、stdpar版のアプリケーションの性能はKokkos版に対し$$pm$$20%の範囲であった。将来的にAMDやIntel GPUにおいて利用可能になるという前提であれば、stdparはエクサスパコンにおいて有力な高生産かつ性能可搬な実装手法となり得る。

論文

二次元格子ボルツマン法に対する局所アンサンブル変換カルマンフィルタ(LETKF)のGPU実装

長谷川 雄太; 小野寺 直幸; 朝比 祐一; 井戸村 泰宏

計算工学講演会論文集(CD-ROM), 27, 4 Pages, 2022/06

局所アンサンブル変換カルマンフィルタ(LETKF)および格子ボルツマン法(LBM)を用いたアンサンブルデータ同化のGPU実装を行った。D2Q9 LBMによる二次元等方性乱流を対象として、最大32アンサンブルで性能測定を行った。LETKFの計算コストは、8アンサンブルまででLBMと同程度であり、それ以上の大アンサンブル数においてはLBMよりも高くなった。32アンサンブルにおいて、1同化サイクルあたりの所要時間はLBMで5.39ms、LETKFで28.3msであった。これらの結果から、3次元LBMの実用計算に本手法を適用するためにはLETKFの更なる高速化が必要であることが示唆される。

論文

適合細分化格子ボルツマン法に基づく都市風況解析コードのNVIDIA及びAMDのGPUにおける性能移植性評価

朝比 祐一; 小野寺 直幸; 長谷川 雄太; 下川辺 隆史*; 芝 隼人*; 井戸村 泰宏

計算工学講演会論文集(CD-ROM), 27, 5 Pages, 2022/06

都市風況解析コードCityLBMをAMD社のMI100 GPUへと移植し、CityLBMの性能をNVIDIA P100, V100, A100およびAMD MI100において測定した。ホスト間でのMPI通信を利用した場合、CityLBMの性能はMI100においてV100と比べ20%程度向上した。適合細分化格子法に起因する補間カーネルを除く演算カーネルでは、MI100においてV100と比べ性能向上を確認した。

論文

Multi-scale turbulence simulation suggesting improvement of electron heated plasma confinement

前山 伸也*; 渡邉 智彦*; 仲田 資季*; 沼波 政倫*; 朝比 祐一; 石澤 明宏*

Nature Communications (Internet), 13, p.3166_1 - 3166_8, 2022/06

 被引用回数:1 パーセンタイル:67.93(Multidisciplinary Sciences)

乱流輸送は、磁場閉じ込め核融合プラズマを閉じ込めるための重要な物理過程である。最近の理論的,実験的研究により 小さい(電子)スケールと大きい(イオン)スケールの乱流の間にクロススケールの相互作用が存在することが明らかにされている。従来の乱流輸送モデルではクロススケール相互作用が考慮されていないため、将来の核燃焼プラズマ実験においてクロススケール相互作用を考慮する必要があるかどうかを明らかにする必要がある。核燃焼プラズマ実験では、核融合で生まれたアルファ粒子によって高い電子温度が維持されるため、プラズマの性質が今まで実験されてきたものと大きく異なると予測される。本論文では、スーパーコンピュータを用いたシミュレーションにより、高電子温度プラズマにおける電子スケールの 電子温度プラズマの乱流は、電子だけでなく燃料や灰の乱流輸送にも影響を与えることを明らかにした。電子スケールの乱流は、イオンスケールの微小的不安定性の原因である共鳴電子の軌道を乱し、大きなスケールの乱流揺らぎを抑制する。同時に、イオンスケールの乱流渦も電子スケールの乱流を抑制する。これらの結果は 異なるスケールの乱流が互いに排他的であることを示す。また、クロススケール相互作用により、熱流束が減少する可能性を示す。

論文

Optimization strategy for a performance portable Vlasov code

朝比 祐一; Latu, G.*; Bigot, J.*; Grandgirard, V.*

Proceedings of 2021 International Workshop on Performance, Portability, and Productivity in HPC (P3HPC) (Internet), p.79 - 91, 2021/11

本論文では、性能可搬な運動論的プラズマシミュレーションコードのための最適化手法について論じる。まず、性能可搬ライブラリKokkosと指示行(OpenACC/OpenMP)により、単一実装でCPU、GPUで実行可能な運動論的プラズマシミュレーションコードを開発した。これに最適化を施し、Intelや富士通のCPUおよびNvidia GPUにおいて最適化の効果を評価した。その結果、OpenACC/OpenMPでは1.07倍から1.39倍の性能向上が見られ、Kokkos版では、1.00倍から1.33倍の性能向上が見られた。複数の実装による様々なカーネルの最適化手法の効果を多数のデバイスにおいて調査した本成果は、最適化手法として幅広く利用可能と言える。Kokkosは複数のデータ構造やループ構造を単一コードによって表現することに長けており、CPUとGPU両方において高い性能を発揮するために適したフレームワークであると確認した。

論文

AMR-Net: Convolutional neural networks for multi-resolution steady flow prediction

朝比 祐一; 畑山 そら*; 下川辺 隆史*; 小野寺 直幸; 長谷川 雄太; 井戸村 泰宏

Proceedings of 2021 IEEE International Conference on Cluster Computing (IEEE Cluster 2021) (Internet), p.686 - 691, 2021/10

 被引用回数:1 パーセンタイル:0.01

多重解像度の定常流を予測する畳み込みニューラルネットワークを開発した。本モデルは、最先端の画像変換モデルpix2pixHDに基づき、パッチ化された符合付き距離関数から高解像度の流れ場の予測が可能である。高解像度データをパッチ化することにより、pix2pixHDと比べてメモリ使用量を削減した。

論文

機械学習による細分化格子に基づく二次元定常流予測

朝比 祐一; 畑山 そら*; 下川辺 隆史*; 小野寺 直幸; 長谷川 雄太; 井戸村 泰宏

計算工学講演会論文集(CD-ROM), 26, 4 Pages, 2021/05

多重解像度の定常流流れ場を符合付き距離関数から予測するConvolutional Neural networkモデルを開発した。高解像度の画像生成を可能とするネットワークPix2PixHDをパッチ化された高解像度データに適用することで、通常のPix2PixHDよりメモリ使用量を削減しつつ、高解像度流れ場の予測が可能であることを示した。

論文

データ駆動アプローチを用いた雪崩的乱流輸送現象の解析

朝比 祐一; 藤井 恵介*

プラズマ・核融合学会誌, 97(2), p.86 - 92, 2021/02

本研究では、5次元ジャイロ運動論的シミュレーションによる大規模データを、データ駆動科学的手法により解析した。まず、少数の波が支配的なコヒーレントな状態と様々な波が入り乱れる乱雑な状態の判別を、特異値分解を用いて行った。これにより突発的に起こる熱輸送現象のあとプラズマは乱雑な状態になること、乱雑さはその後自発的に減少すること、次の突発現象はそのような自己組織化の後に起きることが明らかになった。この過程はLandau減衰をはじめとする速度空間構造の変化と密接に変化していると考えられる。しかし、従来手法では5次元位相空間構造の時系列解析は不可能であった。そこでさらに主成分分析による位相空間構造データの圧縮技術を開発した。圧縮されたデータを利用しても突発的輸送が表現できることや、どのような位相空間構造が突発的輸送と関連しているかを論じる。

論文

Dynamics of enhanced neoclassical particle transport of tracer impurity ions in ion temperature gradient driven turbulence

井戸村 泰宏; Obrejan, K.*; 朝比 祐一; 本多 充*

Physics of Plasmas, 28(1), p.012501_1 - 012501_11, 2021/01

 被引用回数:3 パーセンタイル:58.43(Physics, Fluids & Plasmas)

運動論的電子,バルクイオン,低Zおよび中Zのトレーサ不純物を含む大域的full-fジャイロ運動論シミュレーションを用いてイオン温度勾配駆動(ITG)乱流におけるトレーサ不純物輸送を調べた。この結果、乱流粒子輸送に加えて、乱流輸送と新古典輸送の相乗効果による拡張新古典輸送がトレーサ不純物輸送に大きく寄与することがわかった。ITGモードのバースト的励起が電子とバルクイオンの非両極性乱流粒子束を生成し、これが両極性条件に従う径電場の速い成長をもたらす。これに伴う$$Etimes B$$流の発散が磁気ドリフトによる輸送に関連する上下非対称な密度揺動を圧縮する。この密度揺動の振幅は$$Etimes B$$圧縮効果と磁力線方向運動による帰還電流の競合によって決まるため、拡張新古典輸送はイオン質量に依存する。この機構は温度には働かず、粒子輸送のみを選択的に増大する。

論文

Compressing the time series of five dimensional distribution function data from gyrokinetic simulation using principal component analysis

朝比 祐一; 藤井 恵介*; Heim, D. M.*; 前山 伸也*; Garbet, X.*; Grandgirard, V.*; Sarazin, Y.*; Dif-Pradalier, G.*; 井戸村 泰宏; 矢木 雅敏*

Physics of Plasmas, 28(1), p.012304_1 - 012304_21, 2021/01

 被引用回数:1 パーセンタイル:22.33(Physics, Fluids & Plasmas)

プラズマ乱流の運動論的シミュレーションによって得られた5次元分布関数の時系列データに主成分分析を適用した。これにより、3桁におよぶデータ圧縮を実現しつつ、83%の累積寄与率を保持できた。各主成分ごとの熱輸送への寄与を調べることで、雪崩的熱輸送には速度空間の共鳴構造が関連していることが明らかとなった。

論文

ブロック型適合細分化格子でのPoisson解法のGPU・CPU・ARMプロセッサに対する性能測定

小野寺 直幸; 井戸村 泰宏; 朝比 祐一; 長谷川 雄太; 下川辺 隆史*; 青木 尊之*

第34回数値流体力学シンポジウム講演論文集(インターネット), 2 Pages, 2020/12

本研究では、二相流体解析コードJUPITERにおいて、圧力ポアソン方程式に対するマルチグリッド前提共役勾配(MG-CG)ソルバーを開発した。プログラムの開発言語として、C++およびCUDAを用いることで、様々なコンピュータプラットフォームに対応した。CG解法の主な計算カーネルは、GPU, CPU、およびARM上において、ルーフライン性能の0.4$$sim$$0.75と妥当な性能を達成した。一方で、SpMVカーネルでは、ARM上において、大幅な性能劣化が確認された。その原因を調査したところ、SpMVカーネル内にて関数呼び出しを行うことで、コンパイラの最適化が働かないことが確認された。

論文

Performance portable implementation of a kinetic plasma simulation mini-app with a higher level abstraction and directives

朝比 祐一; Latu, G.*; Bigot, J.*; Grandgirard, V.*

Proceedings of Joint International Conference on Supercomputing in Nuclear Applications + Monte Carlo 2020 (SNA + MC 2020), p.218 - 224, 2020/10

エクサスケール計算機時代には、CPUやGPUの種類を問わずに高性能を発揮する性能可搬性が重要となることが予想される。発表者は、どのような技術を活用すれば運動論的モデルを採用するプラズマ乱流コードの高可搬性実装が可能となるかを調べた。運動論的コードの例として仏国CEAで開発されたGYSELAコードに着目し、当該コードを特徴付ける高次元性(4次元以上)とSemi-Lagrangianスキームといった特徴を抽出したミニアプリケーションを作成した。発表者はミニアプリケーションをOpenACC, OpenMP4.5およびKokkosを用いて並列化し、それぞれの手法の利点,欠点を調査した。OpenACCおよびOpenMP4.5は指示行を挿入することで、Kokkosは高レベルな抽象化を行うことで性能可搬実装を実現する。発表では、生産性,可読性,性能可搬性の観点からそれぞれの手法の利点,欠点を論じる。

論文

Overlapping communications in gyrokinetic codes on accelerator-based platforms

朝比 祐一*; Latu, G.*; Bigot, J.*; 前山 伸也*; Grandgirard, V.*; 井戸村 泰宏

Concurrency and Computation; Practice and Experience, 32(5), p.e5551_1 - e5551_21, 2020/03

 被引用回数:0 パーセンタイル:0.01(Computer Science, Software Engineering)

2つのジャイロ運動論コード、GYSELA, GKVを最新のアクセラレータ環境、Xeon Phi KNL, Tesla P100 GPUに移植した。一台のSkylakeプロセッサーに比べ、KNLにおけるGYSELAの逐次計算カーネルは1.3x、P100 GPUにおけるGKVの逐次計算カーネルは7.4x高速化された。GYSELAとGKVのスケーリングテストをそれぞれ16-512 KNLおよび32-256 P100 GPUで実施し、GYSELAのセミラグランジアンカーネルおよびGKVの畳み込みカーネルにおけるデータ転置通信が主要なボトルネックとなることがわかった。この通信コストを削減するために、これらのコードにパイプライン法およびタスク並列法に基づく通信オーバーラップを実装した。

論文

Synergy of turbulent and neoclassical transport through poloidal convective cells

朝比 祐一*; Grandgirard, V.*; Sarazin, Y.*; Donnel, P.*; Garbet, X.*; 井戸村 泰宏; Dif-Pradalier, G.*; Latu, G.*

Plasma Physics and Controlled Fusion, 61(6), p.065015_1 - 065015_15, 2019/05

 被引用回数:4 パーセンタイル:35.38(Physics, Fluids & Plasmas)

Full-fジャイロ運動論コードGYSELAを用いて輸送過程へのポロイダル対流セルの影響を調べた。この目的のために、対流セルのフィルタを適用し、フィルタ有無のシミュレーション結果を比較した。フィルタを適用することで磁気ドリフトに駆動されるエネルギー束が半減することがわかった。対流セルの周波数スペクトは乱流レイノルズ応力テンソルの周波数と対応し、対流セルが乱流によって駆動されることを示した。この対流セルの効果は乱流と新古典のダイナミクスの相互作用と考えられる。

論文

Turbulent generation of poloidal asymmetries of the electric potential in a tokamak

Donnel, P.*; Garbet, X.*; Sarazin, Y.*; 朝比 祐一; Wilczynski, F.*; Caschera, E.*; Dif-Pradalier, G.*; Ghendrih, P.*; Gillot, C.*

Plasma Physics and Controlled Fusion, 61(1), p.014003_1 - 014003_11, 2019/01

 被引用回数:11 パーセンタイル:74.33(Physics, Fluids & Plasmas)

$$E$$$$times$$$$B$$流のポロイダル非対称性は新古典輸送に影響することが知られている。従来の新古典理論によると、静電ポテンシャルのポロイダル非対称性の大きさは非常に小さいと予測される。本研究では乱流による軸対称ポテンシャル生成の枠組みを提示する。帯状流,測地的音響モード、および、対流セルが単一モデルで記述される。これは準中性条件と連立したジャイロ運動論方程式を解くことによって得られる。この計算は乱流によるある特定の駆動が与えられた場合の流れの周波数スペクトルの予測計算結果をもたらす。また、中間的な周波数では主要な機構が帯状流による圧縮となるのに対し、低周波数では乱流レイノルズ応力のバルーニング構造が主要な駆動機構となることも示された。

論文

Application of a communication-avoiding generalized minimal residual method to a gyrokinetic five dimensional Eulerian code on many core platforms

井戸村 泰宏; 伊奈 拓也*; 真弓 明恵; 山田 進; 松本 和也*; 朝比 祐一*; 今村 俊幸*

Proceedings of 8th Workshop on Latest Advances in Scalable Algorithms for Large-Scale Systems (ScalA 2017), p.7_1 - 7_8, 2017/11

ジャイロ運動論的5次元オイラーコードGT5Dに省通信一般化最小残差(CA-GMRES)法を適用し、一般化共役残差(GCR)法を用いたオリジナルコードとの性能比較をJAEA ICEX(Haswell)、Plasma Simulator(FX100)、Oakforest-PACS(KNL)において実施した。CA-GMRES法はGCR法に比べて約3.8倍の演算密度となることから、メモリとネットワークの帯域が制限された将来のエクサスケールアーキテクチャに適合する。性能評価の結果、GCR法に比べて計算カーネルは1.47$$sim$$2.39倍加速され、1,280ノード処理におけるデータ縮約通信は全体コストの5$$sim$$13%から約1%に削減された。

論文

Benchmarking of flux-driven full-F gyrokinetic simulations

朝比 祐一*; Grandgirard, V.*; 井戸村 泰宏; Garbet, X.*; Latu, G.*; Sarazin, Y.*; Dif-Pradalier, G.*; Donnel, P.*; Ehrlacher, C.*

Physics of Plasmas, 24(10), p.102515_1 - 102515_17, 2017/10

AA2017-0418.pdf:4.26MB

 被引用回数:5 パーセンタイル:31.63(Physics, Fluids & Plasmas)

トカマクプラズマにおける熱流駆動型のイオン温度勾配乱流を計算するために2つの大域的full-Fジャイロ運動論コードのベンチマークを行う。この目的のために、full-Fジャイロ運動論方程式を現実的な熱流束固定条件で計算するセミ・ラグランジアンコードGYSELA、および、オイラーコードGT5Dを採用する。時空間特性に注目して雪崩的な輸送現象を評価した。自己組織化臨界現象(SOC)的な振舞いを議論するために統計解析を実施し、両方のコードで高周波側で$$1/f$$スペクトルから$$1/f^3$$スペクトルへの遷移を確認した。このベンチマークに基づき、SOC的な振舞いは数値計算法に依存しないロバーストな特徴であることを検証した。

論文

Optimization of fusion kernels on accelerators with indirect or strided memory access patterns

朝比 祐一*; Latu, G.*; 伊奈 拓也; 井戸村 泰宏; Grandgirard, V.*; Garbet, X.*

IEEE Transactions on Parallel and Distributed Systems, 28(7), p.1974 - 1988, 2017/07

 被引用回数:6 パーセンタイル:54.78(Computer Science, Theory & Methods)

セミ・ラグランジュ法における間接メモリアクセス、有限差分法におけるストライドメモリアクセスといった複雑なメモリアクセスパターンを有する核融合プラズマ乱流コードの高次元ステンシル計算をGPGPUやXeon Phiプロセッサ等の演算加速器上で最適化した。どちらのデバイスでも、Array of Structure of Array (AOSOA)データレイアウトが連続的なメモリアクセスに有効である。Xeon Phiでは時空間データ局所性の向上によるローカルキャッシュの効率的利用が必要不可欠である。GPGPUではテクスチャメモリの利用がセミ・ラグランジュ法の間接メモリアクセス性能を向上する。これらの最適化により、アクセラレータ用核融合カーネルはCPU用カーネルに比べてSandy Bridge (CPU)用最適化コードに比べて1.4x - 8.1x高速化した。

論文

Computational challenges towards Exa-scale fusion plasma turbulence simulations

井戸村 泰宏; 朝比 祐一; 伊奈 拓也; 松岡 清吉

Proceedings of 24th International Congress of Theoretical and Applied Mechanics (ICTAM 2016), p.3106 - 3107, 2016/08

核融合プラズマにおける乱流輸送はITERにおける重要課題の一つである。この課題を5次元ジャイロ運動論モデルで研究するために新たな計算技術を開発し、ジャイロ運動論的トロイダル5次元オイラーコードGT5Dの強スケーリングを京コンピュータ上で約60万コアまで向上した。この計算技術は多次元/多階層領域分割、通信と計算のオーバーラップ、計算カーネルのマルチコアCPUへの最適化から構成される。この計算性能によって乱流輸送の装置サイズ依存性等のITERの重要課題の研究が可能になった。次世代の核燃焼プラズマ乱流シミュレーションに向けて、運動論的電子や多種イオンを含む物理モデルの拡張を進め、さらに最新のメニーコア環境で計算カーネルを最適化した。

論文

Erosion of $$N$$=20 shell in $$^{33}$$Al investigated through the ground-state electric quadrupole moment

島田 健司*; 上野 秀樹*; Neyens, G.*; 旭 耕一郎*; Balabanski, D. L.*; Daugas, J. M.*; Depuydt, M.*; De Rydt, M.*; Gaudefroy, L.*; Gr$'e$vy, S.*; et al.

Physics Letters B, 714(2-5), p.246 - 250, 2012/08

 被引用回数:7 パーセンタイル:42.81(Astronomy & Astrophysics)

中性子過剰核における魔法数消滅の研究を目的として、フランスGANIL研究所にて、ベータNMR法を用いて中性子過剰核$$^{33}$$Alの電気的四重極モーメント($$Q$$モーメント)の測定を行った。得られた$$Q$$モーメントの値の絶対値は、133(18)$$e$$mbとなった。この実験値を殻模型及び粒子・振動結合模型の二つの理論模型の値と比較した。その結果、中性子数20の閉殻構造消失を考慮に入れていない従来の殻模型計算では、$$Q$$モーメントを過小評価する一方、魔法数消滅を考慮に入れた大規模殻模型計算では実験値を正しく再現した。同様の値が、中性子数20の閉殻構造消失を考慮に入れた粒子・振動結合模型でも得られた。その結果、中性子20の閉殻構造は$$^{33}$$Al核でも相当程度消失していることが判明した。

54 件中 1件目~20件目を表示