検索対象:     
報告書番号:
※ 半角英数字
 年 ~ 
 年
検索結果: 66 件中 1件目~20件目を表示

発表形式

Initialising ...

選択項目を絞り込む

掲載資料名

Initialising ...

発表会議名

Initialising ...

筆頭著者名

Initialising ...

キーワード

Initialising ...

使用言語

Initialising ...

発行年

Initialising ...

開催年

Initialising ...

選択した検索結果をダウンロード

論文

Continuous data assimilation of large eddy simulation by lattice Boltzmann method and local ensemble transform Kalman filter (LBM-LETKF)

長谷川 雄太; 小野寺 直幸; 朝比 祐一; 伊奈 拓也; 今村 俊幸*; 井戸村 泰宏

Fluid Dynamics Research, 55(6), p.065501_1 - 065501_25, 2023/11

格子ボルツマン法(LBM)に基づくラージエディーシミュレーション(LES)に対するデータ同化の適用性を調査した。2次元等方乱流の観測システムシミュレーション実験を行い、空間的に疎かつノイズを含む観測を用いてナッジング法及び局所アンサンブル変換カルマンフィルタによるデータ同化の精度を検証した。LETKFの利点として、ナッジングで必要となる空間補間及び巨視的量(流体密度及び流速)からLBMの速度分布関数への変換を必要としないことが挙げられる。計算条件として$$256times256$$格子及び10%の流速観測ノイズを設定した実験では、64アンサンブルのLETKFは$$8times8$$の観測点(計算格子点数に対して0.1%程度)でも観測ノイズよりも小さい誤差を示した。これは、ナッジングで同様の精度を示すのに1桁程度多くの観測点数を要する精度である。さらに、LETKFでは観測点数の不足はエネルギースペクトルの振幅には影響せず、スペクトルの位相誤差のみに影響することが確認された。以上の結果により、LETKFは、空間的に疎かつノイズを含む観測を用いた2次元のLBM計算のデータ同化に対してロバストかつ高精度であることが示された。

論文

アンサンブルカルマンフィルタを用いた都市風況解析のためのパラメータ最適化

小野寺 直幸; 井戸村 泰宏; 長谷川 雄太; 朝比 祐一; 稲垣 厚至*; 下瀬 健一*; 平野 洪賓*

計算工学講演会論文集(CD-ROM), 28, 4 Pages, 2023/05

我々の研究グループでは、都市全域を含む広域の風況場から細かな路地等を捉えたマルチスケールの風況シミュレーションコードCityLBMの開発を進めている。CityLBMは、格子ボルツマン法に適合細分化格子を適用した省メモリ化、および、GPUスーパーコンピュータによる高性能計算により、数km四方に対してリアルタイムのアンサンブルシミュレーションが可能となる。一方、実現象には、モデル化できない複雑な境界条件が含まれているため、観測データをシミュレーションに反映させるためのデータ同化技術が必要である。本研究では、現実の風況を再現するために、アンサンブルカルマンフィルターに基づく地表面温度バイアスの最適化手法を提案した。CityLBMの検証として、東京都心部を対象とした観測システムシミュレーション実験を実施し、地表面近傍の温度から、境界条件として与えている地表面温度を推定する。

論文

CityTransformer; A Transformer-based model for contaminant dispersion prediction in a realistic urban area

朝比 祐一; 小野寺 直幸; 長谷川 雄太; 下川辺 隆史*; 芝 隼人*; 井戸村 泰宏

Boundary-Layer Meteorology, 34 Pages, 2023/01

 被引用回数:0 パーセンタイル:0.01(Meteorology & Atmospheric Sciences)

定点観測された風向などの時系列データおよび汚染物質放出点を入力として、汚染物質の地表面拡散分布を予測する機械学習モデルを開発した。問題設定としては、一様風が都市部へ流入し、都市部内にランダムに設置された汚染物質放出点から汚染物質が拡散するという状況を扱っている。機械学習モデルとしては、汚染物質放出点から汚染物質の拡散分布を予測するCNNモデルを用いた。風向などの時系列データは、Transformerや多層パーセプトロンによってEncodeし、CNNへと引き渡す。これによって、現実的に取得可能な定点測時系列データのみを入力とし、実用上価値の高い汚染物質の地表面拡散分布の予測を可能とした。同一のモデルを用いて定点観測時系列データから汚染物質放出点の予測が可能であることも示した。

論文

格子ボルツマン法と局所アンサンブル変換カルマンフィルタ(LBM-LETKF)による3次元乱流データ同化

長谷川 雄太; 小野寺 直幸; 朝比 祐一; 井戸村 泰宏

第36回数値流体力学シンポジウム講演論文集(インターネット), 5 Pages, 2022/12

格子ボルツマン法と局所アンサンブル変換カルマンフィルタ(LBM-LETKF)による乱流のアンサンブルデータ同化をGPUに実装し、精度の検証を行なった。32GPUを用いて、格子点数2.3$$times10^{7}$$、アンサンブル数32の条件で、3次元角柱周りの流れ対してデータ同化実験を実施した。本実験におけるデータ同化の時間間隔は、カルマン渦周期の半分に設定した。精度として、揚力係数の誤差(normalized mean absolute error; NMAE)を測定したところ、データ同化なし、ナッジング法(より単純なデータ同化手法)による同化、およびLETKFのそれぞれにおいて、誤差は132%, 148%、および13.2%であった。これにより、観測頻度が低い本計算条件においては、ナッジング法のような簡易な手法では解に系統的な遅れが現れてデータ同化の精度を保つことができない一方で、LETKFでは良好なデータ同化精度を示すことが確認できた。

論文

C++ parallel algorithmによる性能可搬性評価

朝比 祐一; Padioleau, T.*; Latu, G.*; Bigot, J.*; Grandgirard, V.*; Obrejan, K.*

第36回数値流体力学シンポジウム講演論文集(インターネット), 8 Pages, 2022/12

本論文では、運動論的プラズマシミュレーションコードを例としてC++ parallel algorithm (stdpar)による性能可搬実装について論じる。言語標準の並列アルゴリズムstdparと抽象的高次元配列mdspanにより、可読性および生産性を損なわずに性能可搬な実装が可能であることを示す。抽象化により性能可搬性を実現するKokkosや、指示行によって性能可搬性を実現するOpenMPとの比較により、stdparの性能,可搬性,生産性などを論じる。Intel Icelake, NVIDIA V100およびA100 GPUにおいて、stdpar版のアプリケーションの性能はKokkos版に対し$$pm$$20%の範囲であった。将来的にAMDやIntel GPUにおいて利用可能になるという前提であれば、stdparはエクサスパコンにおいて有力な高生産かつ性能可搬な実装手法となり得る。

論文

Performance portable Vlasov code with C++ parallel algorithm

朝比 祐一; Padioleau, T.*; Latu, G.*; Bigot, J.*; Grandgirard, V.*; Obrejan, K.*

Proceedings of 2022 International Workshop on Performance, Portability, and Productivity in HPC (P3HPC) (Internet), p.68 - 80, 2022/11

 被引用回数:0 パーセンタイル:0

本論文では、C++ parallel algorithmによる性能可搬な運動論的プラズマシミュレーションコードの実装について論じる。言語標準の並列アルゴリズムstdparと抽象的高次元配列mdspanにより、可読性および生産性を損なわずに性能可搬な実装が可能であることを示す。Intel Icelake、NVIDIA V100およびA100 GPUにおいて、アプリケーションの性能はKokkos版に対し$$pm$$ 20%の範囲であった。将来的にAMDやIntel GPUにおいて利用可能になるという前提であれば、C++ parallel algorithmはエクサスパコンにおいて有力な高生産かつ性能可搬な実装手法となり得る。

論文

二次元格子ボルツマン法に対する局所アンサンブル変換カルマンフィルタ(LETKF)のGPU実装

長谷川 雄太; 小野寺 直幸; 朝比 祐一; 井戸村 泰宏

計算工学講演会論文集(CD-ROM), 27, 4 Pages, 2022/06

局所アンサンブル変換カルマンフィルタ(LETKF)および格子ボルツマン法(LBM)を用いたアンサンブルデータ同化のGPU実装を行った。D2Q9 LBMによる二次元等方性乱流を対象として、最大32アンサンブルで性能測定を行った。LETKFの計算コストは、8アンサンブルまででLBMと同程度であり、それ以上の大アンサンブル数においてはLBMよりも高くなった。32アンサンブルにおいて、1同化サイクルあたりの所要時間はLBMで5.39ms、LETKFで28.3msであった。これらの結果から、3次元LBMの実用計算に本手法を適用するためにはLETKFの更なる高速化が必要であることが示唆される。

論文

適合細分化格子ボルツマン法に基づく都市風況解析コードのNVIDIA及びAMDのGPUにおける性能移植性評価

朝比 祐一; 小野寺 直幸; 長谷川 雄太; 下川辺 隆史*; 芝 隼人*; 井戸村 泰宏

計算工学講演会論文集(CD-ROM), 27, 5 Pages, 2022/06

都市風況解析コードCityLBMをAMD社のMI100 GPUへと移植し、CityLBMの性能をNVIDIA P100, V100, A100およびAMD MI100において測定した。ホスト間でのMPI通信を利用した場合、CityLBMの性能はMI100においてV100と比べ20%程度向上した。適合細分化格子法に起因する補間カーネルを除く演算カーネルでは、MI100においてV100と比べ性能向上を確認した。

論文

Multi-scale turbulence simulation suggesting improvement of electron heated plasma confinement

前山 伸也*; 渡邉 智彦*; 仲田 資季*; 沼波 政倫*; 朝比 祐一; 石澤 明宏*

Nature Communications (Internet), 13, p.3166_1 - 3166_8, 2022/06

 被引用回数:7 パーセンタイル:92.8(Multidisciplinary Sciences)

乱流輸送は、磁場閉じ込め核融合プラズマを閉じ込めるための重要な物理過程である。最近の理論的,実験的研究により 小さい(電子)スケールと大きい(イオン)スケールの乱流の間にクロススケールの相互作用が存在することが明らかにされている。従来の乱流輸送モデルではクロススケール相互作用が考慮されていないため、将来の核燃焼プラズマ実験においてクロススケール相互作用を考慮する必要があるかどうかを明らかにする必要がある。核燃焼プラズマ実験では、核融合で生まれたアルファ粒子によって高い電子温度が維持されるため、プラズマの性質が今まで実験されてきたものと大きく異なると予測される。本論文では、スーパーコンピュータを用いたシミュレーションにより、高電子温度プラズマにおける電子スケールの 電子温度プラズマの乱流は、電子だけでなく燃料や灰の乱流輸送にも影響を与えることを明らかにした。電子スケールの乱流は、イオンスケールの微小的不安定性の原因である共鳴電子の軌道を乱し、大きなスケールの乱流揺らぎを抑制する。同時に、イオンスケールの乱流渦も電子スケールの乱流を抑制する。これらの結果は 異なるスケールの乱流が互いに排他的であることを示す。また、クロススケール相互作用により、熱流束が減少する可能性を示す。

論文

GPU optimization of lattice Boltzmann method with local ensemble transform Kalman filter

長谷川 雄太; 今村 俊幸*; 伊奈 拓也; 小野寺 直幸; 朝比 祐一; 井戸村 泰宏

Proceedings of 13th Workshop on Latest Advances in Scalable Algorithms for Large-Scale Heterogeneous Systems (ScalAH22) (Internet), p.10 - 17, 2022/00

格子ボルツマン法(LBM)に基づく数値流体力学シミュレーションおよび局所アンサンブル変換カルマンフィルタ(LETKF)によるアンサンブルデータ同化をNVIDIA A100 GPU搭載スパコンに対して実装し、および最適化した。LBMとLETKFの協働のため、データ転置通信を実装し、LETKFのデータ依存性に基づいて計算,ファイルI/O、および通信のオーバーラップにより通信を最適化した。2次元等方乱流,アンサンブル数$$M=64$$,格子点数$$N_x=128^2$$の条件において、通信を最適化した実装は、LETKFを並列化しない単純な実装に対して3.85倍の高速化を達成した。LETKFの主要な計算カーネルは$$Mtimes M$$の実対称密行列の固有値分解であり、その計算のため、バッチ形式固有値分解ソルバEigenGを新たに開発した。EigenGによるバッチ形式固有値分解は、既存ライブラリであるcuSolverに対して64倍の高速化を達成した。

論文

Optimization strategy for a performance portable Vlasov code

朝比 祐一; Latu, G.*; Bigot, J.*; Grandgirard, V.*

Proceedings of 2021 International Workshop on Performance, Portability, and Productivity in HPC (P3HPC) (Internet), p.79 - 91, 2021/11

本論文では、性能可搬な運動論的プラズマシミュレーションコードのための最適化手法について論じる。まず、性能可搬ライブラリKokkosと指示行(OpenACC/OpenMP)により、単一実装でCPU、GPUで実行可能な運動論的プラズマシミュレーションコードを開発した。これに最適化を施し、Intelや富士通のCPUおよびNvidia GPUにおいて最適化の効果を評価した。その結果、OpenACC/OpenMPでは1.07倍から1.39倍の性能向上が見られ、Kokkos版では、1.00倍から1.33倍の性能向上が見られた。複数の実装による様々なカーネルの最適化手法の効果を多数のデバイスにおいて調査した本成果は、最適化手法として幅広く利用可能と言える。Kokkosは複数のデータ構造やループ構造を単一コードによって表現することに長けており、CPUとGPU両方において高い性能を発揮するために適したフレームワークであると確認した。

論文

AMR-Net: Convolutional neural networks for multi-resolution steady flow prediction

朝比 祐一; 畑山 そら*; 下川辺 隆史*; 小野寺 直幸; 長谷川 雄太; 井戸村 泰宏

Proceedings of 2021 IEEE International Conference on Cluster Computing (IEEE Cluster 2021) (Internet), p.686 - 691, 2021/10

 被引用回数:1 パーセンタイル:54.37

多重解像度の定常流を予測する畳み込みニューラルネットワークを開発した。本モデルは、最先端の画像変換モデルpix2pixHDに基づき、パッチ化された符合付き距離関数から高解像度の流れ場の予測が可能である。高解像度データをパッチ化することにより、pix2pixHDと比べてメモリ使用量を削減した。

論文

機械学習による細分化格子に基づく二次元定常流予測

朝比 祐一; 畑山 そら*; 下川辺 隆史*; 小野寺 直幸; 長谷川 雄太; 井戸村 泰宏

計算工学講演会論文集(CD-ROM), 26, 4 Pages, 2021/05

多重解像度の定常流流れ場を符合付き距離関数から予測するConvolutional Neural networkモデルを開発した。高解像度の画像生成を可能とするネットワークPix2PixHDをパッチ化された高解像度データに適用することで、通常のPix2PixHDよりメモリ使用量を削減しつつ、高解像度流れ場の予測が可能であることを示した。

論文

データ駆動アプローチを用いた雪崩的乱流輸送現象の解析

朝比 祐一; 藤井 恵介*

プラズマ・核融合学会誌, 97(2), p.86 - 92, 2021/02

本研究では、5次元ジャイロ運動論的シミュレーションによる大規模データを、データ駆動科学的手法により解析した。まず、少数の波が支配的なコヒーレントな状態と様々な波が入り乱れる乱雑な状態の判別を、特異値分解を用いて行った。これにより突発的に起こる熱輸送現象のあとプラズマは乱雑な状態になること、乱雑さはその後自発的に減少すること、次の突発現象はそのような自己組織化の後に起きることが明らかになった。この過程はLandau減衰をはじめとする速度空間構造の変化と密接に変化していると考えられる。しかし、従来手法では5次元位相空間構造の時系列解析は不可能であった。そこでさらに主成分分析による位相空間構造データの圧縮技術を開発した。圧縮されたデータを利用しても突発的輸送が表現できることや、どのような位相空間構造が突発的輸送と関連しているかを論じる。

論文

Dynamics of enhanced neoclassical particle transport of tracer impurity ions in ion temperature gradient driven turbulence

井戸村 泰宏; Obrejan, K.*; 朝比 祐一; 本多 充*

Physics of Plasmas, 28(1), p.012501_1 - 012501_11, 2021/01

 被引用回数:6 パーセンタイル:61.49(Physics, Fluids & Plasmas)

運動論的電子,バルクイオン,低Zおよび中Zのトレーサ不純物を含む大域的full-fジャイロ運動論シミュレーションを用いてイオン温度勾配駆動(ITG)乱流におけるトレーサ不純物輸送を調べた。この結果、乱流粒子輸送に加えて、乱流輸送と新古典輸送の相乗効果による拡張新古典輸送がトレーサ不純物輸送に大きく寄与することがわかった。ITGモードのバースト的励起が電子とバルクイオンの非両極性乱流粒子束を生成し、これが両極性条件に従う径電場の速い成長をもたらす。これに伴う$$Etimes B$$流の発散が磁気ドリフトによる輸送に関連する上下非対称な密度揺動を圧縮する。この密度揺動の振幅は$$Etimes B$$圧縮効果と磁力線方向運動による帰還電流の競合によって決まるため、拡張新古典輸送はイオン質量に依存する。この機構は温度には働かず、粒子輸送のみを選択的に増大する。

論文

Compressing the time series of five dimensional distribution function data from gyrokinetic simulation using principal component analysis

朝比 祐一; 藤井 恵介*; Heim, D. M.*; 前山 伸也*; Garbet, X.*; Grandgirard, V.*; Sarazin, Y.*; Dif-Pradalier, G.*; 井戸村 泰宏; 矢木 雅敏*

Physics of Plasmas, 28(1), p.012304_1 - 012304_21, 2021/01

AA2020-0790.pdf:7.13MB

 被引用回数:4 パーセンタイル:44.85(Physics, Fluids & Plasmas)

プラズマ乱流の運動論的シミュレーションによって得られた5次元分布関数の時系列データに主成分分析を適用した。これにより、3桁におよぶデータ圧縮を実現しつつ、83%の累積寄与率を保持できた。各主成分ごとの熱輸送への寄与を調べることで、雪崩的熱輸送には速度空間の共鳴構造が関連していることが明らかとなった。

論文

ブロック型適合細分化格子でのPoisson解法のGPU・CPU・ARMプロセッサに対する性能測定

小野寺 直幸; 井戸村 泰宏; 朝比 祐一; 長谷川 雄太; 下川辺 隆史*; 青木 尊之*

第34回数値流体力学シンポジウム講演論文集(インターネット), 2 Pages, 2020/12

本研究では、二相流体解析コードJUPITERにおいて、圧力ポアソン方程式に対するマルチグリッド前提共役勾配(MG-CG)ソルバーを開発した。プログラムの開発言語として、C++およびCUDAを用いることで、様々なコンピュータプラットフォームに対応した。CG解法の主な計算カーネルは、GPU, CPU、およびARM上において、ルーフライン性能の0.4$$sim$$0.75と妥当な性能を達成した。一方で、SpMVカーネルでは、ARM上において、大幅な性能劣化が確認された。その原因を調査したところ、SpMVカーネル内にて関数呼び出しを行うことで、コンパイラの最適化が働かないことが確認された。

論文

Performance portable implementation of a kinetic plasma simulation mini-app with a higher level abstraction and directives

朝比 祐一; Latu, G.*; Bigot, J.*; Grandgirard, V.*

Proceedings of Joint International Conference on Supercomputing in Nuclear Applications + Monte Carlo 2020 (SNA + MC 2020), p.218 - 224, 2020/10

エクサスケール計算機時代には、CPUやGPUの種類を問わずに高性能を発揮する性能可搬性が重要となることが予想される。発表者は、どのような技術を活用すれば運動論的モデルを採用するプラズマ乱流コードの高可搬性実装が可能となるかを調べた。運動論的コードの例として仏国CEAで開発されたGYSELAコードに着目し、当該コードを特徴付ける高次元性(4次元以上)とSemi-Lagrangianスキームといった特徴を抽出したミニアプリケーションを作成した。発表者はミニアプリケーションをOpenACC, OpenMP4.5およびKokkosを用いて並列化し、それぞれの手法の利点,欠点を調査した。OpenACCおよびOpenMP4.5は指示行を挿入することで、Kokkosは高レベルな抽象化を行うことで性能可搬実装を実現する。発表では、生産性,可読性,性能可搬性の観点からそれぞれの手法の利点,欠点を論じる。

論文

Overlapping communications in gyrokinetic codes on accelerator-based platforms

朝比 祐一*; Latu, G.*; Bigot, J.*; 前山 伸也*; Grandgirard, V.*; 井戸村 泰宏

Concurrency and Computation; Practice and Experience, 32(5), p.e5551_1 - e5551_21, 2020/03

 被引用回数:1 パーセンタイル:14.19(Computer Science, Software Engineering)

2つのジャイロ運動論コード、GYSELA, GKVを最新のアクセラレータ環境、Xeon Phi KNL, Tesla P100 GPUに移植した。一台のSkylakeプロセッサーに比べ、KNLにおけるGYSELAの逐次計算カーネルは1.3x、P100 GPUにおけるGKVの逐次計算カーネルは7.4x高速化された。GYSELAとGKVのスケーリングテストをそれぞれ16-512 KNLおよび32-256 P100 GPUで実施し、GYSELAのセミラグランジアンカーネルおよびGKVの畳み込みカーネルにおけるデータ転置通信が主要なボトルネックとなることがわかった。この通信コストを削減するために、これらのコードにパイプライン法およびタスク並列法に基づく通信オーバーラップを実装した。

論文

Synergy of turbulent and neoclassical transport through poloidal convective cells

朝比 祐一*; Grandgirard, V.*; Sarazin, Y.*; Donnel, P.*; Garbet, X.*; 井戸村 泰宏; Dif-Pradalier, G.*; Latu, G.*

Plasma Physics and Controlled Fusion, 61(6), p.065015_1 - 065015_15, 2019/05

 被引用回数:4 パーセンタイル:27.54(Physics, Fluids & Plasmas)

Full-fジャイロ運動論コードGYSELAを用いて輸送過程へのポロイダル対流セルの影響を調べた。この目的のために、対流セルのフィルタを適用し、フィルタ有無のシミュレーション結果を比較した。フィルタを適用することで磁気ドリフトに駆動されるエネルギー束が半減することがわかった。対流セルの周波数スペクトは乱流レイノルズ応力テンソルの周波数と対応し、対流セルが乱流によって駆動されることを示した。この対流セルの効果は乱流と新古典のダイナミクスの相互作用と考えられる。

66 件中 1件目~20件目を表示