検索対象:     
報告書番号:
※ 半角英数字
 年 ~ 
 年
検索結果: 397 件中 1件目~20件目を表示

発表形式

Initialising ...

選択項目を絞り込む

掲載資料名

Initialising ...

発表会議名

Initialising ...

筆頭著者名

Initialising ...

キーワード

Initialising ...

使用言語

Initialising ...

発行年

Initialising ...

開催年

Initialising ...

選択した検索結果をダウンロード

論文

Tree cutting approach for domain partitioning on forest-of-octrees-based block-structured static adaptive mesh refinement with lattice Boltzmann method

長谷川 雄太; 青木 尊之*; 小林 宏充*; 井戸村 泰宏; 小野寺 直幸

Parallel Computing, 108, p.102851_1 - 102851_12, 2021/12

GPUスーパコンピュータに対して格子ボルツマン法(LBM: lattice Botltzmann method)およびforest-of-octreesに基づくブロック構造型の局所細分化格子(LMR; local mesh refinement)を用いた空力解析コードを実装し、その性能を評価した。性能評価の結果、従来の空間充填曲線(SFC; space-filling curve)に基づく領域分割アルゴリズムでは、本空力解析において袖領域通信のコストが過大となることがわかった。領域分割の改善手法として本稿では挿し木法を提案し、領域分割の局所性とトポロジーを改善し、従来のSFCに基づく手法に比べて通信コストを1/3$$sim$$1/4に削減した。強スケーリング測定では、最大で1.82倍の高速化を示し、128GPUで2207MLUPS(mega-lattice update per second)の性能を達成した。弱スケーリング測定では、8$$sim$$128GPUで93.4%の並列化効率を示し、最大規模の128GPU計算では44.73億格子点を用いて9620MLUPSの性能を達成した。

論文

Neoclassical transport simulations with an improved model collision operator

松岡 清吉*; 洲鎌 英雄*; 井戸村 泰宏

Physics of Plasmas, 28(6), p.064501_1 - 064501_5, 2021/06

 被引用回数:0

線形ランダウ衝突演算子から得られる摩擦係数と流束の関係式を再現可能な洲鎌らの改良型モデル衝突演算子を大域的full-fジャイロ運動論シミュレーションコードGT5Dに新たに実装し、トカマクにおける単一イオン種プラズマの衝突性輸送シミュレーションを幅広い衝突度領域において実施した。摩擦係数と流束の関係式において高い精度が要求される高衝突度領域において、改良型演算子が理論的な衝突性熱拡散係数を正確に再現することを検証した。さらに、改良型演算子によって全ての衝突度領域において衝突性熱拡散係数と磁力線方向流れの係数をより高い精度で得ることにより、線形ランダウ衝突演算子によって記述される衝突過程が正しく保持されていることを実証した。

論文

Real-time tracer dispersion simulations in Oklahoma City using the locally mesh-refined lattice Boltzmann method

小野寺 直幸; 井戸村 泰宏; 長谷川 雄太; 中山 浩成; 下川辺 隆史*; 青木 尊之*

Boundary-Layer Meteorology, 179(2), p.187 - 208, 2021/05

 被引用回数:2 パーセンタイル:89.67(Meteorology & Atmospheric Sciences)

汚染物質の拡散解析手法CityLBMは、GPUスーパーコンピュータ上において、適合細分化格子(AMR)法を適用する事で、数kmの解析領域の実時間解析が可能である。本論文では、CityLBMの検証としてオクラホマ市で実施された野外拡散実験(JU2003)に対する解析を実施した。計算条件として、Weather Research and Forecasting(WRF)モデルを用いた風況条件および、建物と植生を考慮した地表面データをCityLBMに与えることで、JU2003の実験条件を再現した。さらにアンサンブル計算の実施により、乱流の不確実性を軽減した。汚染物質の時間平均濃度および最大値を実験測定値と比較した結果、アンサンブル計算により解析精度を向上すると共に、2m解像度・4km四方の解析では、24個の計測値に対して70%の高い割合でFactor2を満たす事を確認した。

論文

木構造に基づく細分化格子LBMにおける領域分割法の改善

長谷川 雄太; 青木 尊之*; 小林 宏充*; 井戸村 泰宏; 小野寺 直幸

計算工学講演会論文集(CD-ROM), 26, 6 Pages, 2021/05

Forest-of-octreesに基づく局所格子細分化法(LMR)を導入した格子ボルツマン法(LBM)に基づく空力解析コードに対し、挿し木法による領域分割の改善手法を提案した。従来の空間充填曲線に基づく領域分割法は、適合格子細分化法(AMR)やLMRで広く用いられているものの、GPUスパコン向けに実装された本空力解析コードにおいては袖領域通信が増大し計算のボトルネックとなるうることが確認された。本研究で提案する挿し木法は、粗い等間隔格子状の領域分割と細かい空間充填曲線に基づく分割のハイブリッドによる手法である。挿し木法により、領域分割の局所性と幾何形状が改善しており、通信量が従来の空間充填曲線に基づく手法に比べて3分の1に削減された。8GPU並列による性能検証では、コード全体で1.23倍の高速化が確認された。また、強スケーリングにおいてさらに性能の改善が見られ、128GPUの強スケーリングにおいては、従来手法に比べて1.82倍の高速化を示し、2207MLUPS (mega-lattice update per second)の計算性能を達成した。

論文

ブロック型適合細分化格子でのPoisson解法の混合精度演算による高速化

小野寺 直幸; 井戸村 泰宏; 長谷川 雄太; 下川辺 隆史*; 青木 尊之*

計算工学講演会論文集(CD-ROM), 26, 3 Pages, 2021/05

本研究では、二相流体解析コードJUPITER-AMRに対して、圧力ポアソン方程式に対する混合精度前処理手法を開発した。マルチグリッド前処理手法として、3段のVサイクルの幾何学的MG法およびキャッシュを再利用したSOR(CR-SOR)法を適用した。原子力工学問題での性能測定として、バンドル体系に対する多相流体解析を実施した。計算速度として、単精度演算を適用する事で、倍精度演算の75%へと削減すると共に、強スケーリング性能においては、32台から96台のGPUを利用する事で1.88倍を実現した。

論文

機械学習による細分化格子に基づく二次元定常流予測

朝比 祐一; 畑山 そら*; 下川辺 隆史*; 小野寺 直幸; 長谷川 雄太; 井戸村 泰宏

計算工学講演会論文集(CD-ROM), 26, 4 Pages, 2021/05

多重解像度の定常流流れ場を符合付き距離関数から予測するConvolutional Neural networkモデルを開発した。高解像度の画像生成を可能とするネットワークPix2PixHDをパッチ化された高解像度データに適用することで、通常のPix2PixHDよりメモリ使用量を削減しつつ、高解像度流れ場の予測が可能であることを示した。

論文

Dynamics of enhanced neoclassical particle transport of tracer impurity ions in ion temperature gradient driven turbulence

井戸村 泰宏; Obrejan, K.*; 朝比 祐一; 本多 充*

Physics of Plasmas, 28(1), p.012501_1 - 012501_11, 2021/01

 被引用回数:3 パーセンタイル:92.52(Physics, Fluids & Plasmas)

運動論的電子,バルクイオン,低Zおよび中Zのトレーサ不純物を含む大域的full-fジャイロ運動論シミュレーションを用いてイオン温度勾配駆動(ITG)乱流におけるトレーサ不純物輸送を調べた。この結果、乱流粒子輸送に加えて、乱流輸送と新古典輸送の相乗効果による拡張新古典輸送がトレーサ不純物輸送に大きく寄与することがわかった。ITGモードのバースト的励起が電子とバルクイオンの非両極性乱流粒子束を生成し、これが両極性条件に従う径電場の速い成長をもたらす。これに伴う$$Etimes B$$流の発散が磁気ドリフトによる輸送に関連する上下非対称な密度揺動を圧縮する。この密度揺動の振幅は$$Etimes B$$圧縮効果と磁力線方向運動による帰還電流の競合によって決まるため、拡張新古典輸送はイオン質量に依存する。この機構は温度には働かず、粒子輸送のみを選択的に増大する。

論文

GPU acceleration of multigrid preconditioned conjugate gradient solver on block-structured Cartesian grid

小野寺 直幸; 井戸村 泰宏; 長谷川 雄太; 山下 晋; 下川辺 隆史*; 青木 尊之*

Proceedings of International Conference on High Performance Computing in Asia-Pacific Region (HPC Asia 2021) (Internet), p.120 - 128, 2021/01

 被引用回数:0 パーセンタイル:0.01

本研究では、二相流体解析コードJUPITERに対して、マルチグリッド前処理付き共役勾配(MG-CG)法を開発した。MG法は、3段のVサイクルMG法に基づいて構築し、各段に対して、RB-SOR法およびGPUのキャッシュを再利用したCR-SORを開発・適用した。性能測定として、バンドル体系に対する気液二相流体解析を行った。RB-SOR法およびCR-SOR法を適用したMG-CG法では、MG法を適用しないPCG法と比較して、収束までの反復回数を15%と9%以下に削減するとともに、3.1倍, 5.9倍の計算速度が達成された。以上の結果から、本研究で開発したMG-CG法は、GPUを用いたスーパーコンピュータ上にて、効率的に大規模な二相流体解析が可能であることが示された。

論文

格子ボルツマン法のアンサンブル計算に基づく汚染物質拡散解析

長谷川 雄太; 小野寺 直幸; 井戸村 泰宏

第34回数値流体力学シンポジウム講演論文集(インターネット), 3 Pages, 2020/12

都市風況および汚染物質拡散解析を行うため、局所細分化格子ボルツマン法を用いた実時間アンサンブル計算コードを開発した。開発したコードを、産業技術総合研究所による風洞実験、およびオクラホマシティでの野外拡散実験JU2003と比較した。風洞実験に対する検証では、風況は実験とよく一致するとともに、トレーサ物質の濃度は、環境アセスメントガイドラインで示されている評価指標であるFACTOR2に対し、61.2%の正答率を達成した。野外拡散実験JU2003においては、風速の瞬時値は実験とよく一致したが、風向は最大で100$$^{circ}$$のずれがあった。一方で、トレーサ物質濃度の平均値は、全時間区間においてFACTOR2を満たした。以上の結果より本コードは環境アセスメントに対して十分な精度を持つことを示した。

論文

富岳およびSummitにおける核融合プラズマ流体解析の高速化

井戸村 泰宏; 伊奈 拓也*; Ali, Y.*; 今村 俊幸*

第34回数値流体力学シンポジウム講演論文集(インターネット), 6 Pages, 2020/12

ジャイロ運動論的トロイダル5次元full-fオイラーコードGT5Dにおける半陰解法差分計算用に新しいFP16(半精度)前処理付き省通信クリロフソルバを開発した。このソルバでは、大域的集団通信のボトルネックを省通信クリロフ部分空間法によって解決し、さらに収束特性を向上するFP16前処理によって袖通信を削減した。FP16前処理は演算子の物理特性に基づいて設計し、A64FXで新たにサポートされたFP16SIMD処理を用いた実装した。このソルバをGPUにも移植し、約1,000億格子のITER規模計算の性能を富岳(A64FX)とSummit(V100)で測定した。従来の非省通信型ソルバに比べて、新しいソルバはGT5Dを$$2 sim3$$倍加速し、富岳とSummitの両方で5,760CPU/GPUまで良好な強スケーリングが得られた。

論文

ブロック型適合細分化格子でのPoisson解法のGPU・CPU・ARMプロセッサに対する性能測定

小野寺 直幸; 井戸村 泰宏; 朝比 祐一; 長谷川 雄太; 下川辺 隆史*; 青木 尊之*

第34回数値流体力学シンポジウム講演論文集(インターネット), 2 Pages, 2020/12

本研究では、二相流体解析コードJUPITERにおいて、圧力ポアソン方程式に対するマルチグリッド前提共役勾配(MG-CG)ソルバーを開発した。プログラムの開発言語として、C++およびCUDAを用いることで、様々なコンピュータプラットフォームに対応した。CG解法の主な計算カーネルは、GPU, CPU、およびARM上において、ルーフライン性能の0.4$$sim$$0.75と妥当な性能を達成した。一方で、SpMVカーネルでは、ARM上において、大幅な性能劣化が確認された。その原因を調査したところ、SpMVカーネル内にて関数呼び出しを行うことで、コンパイラの最適化が働かないことが確認された。

論文

Acceleration of fusion plasma turbulence simulations using the mixed-precision communication-avoiding Krylov method

井戸村 泰宏; 伊奈 拓也*; Ali, Y.*; 今村 俊幸*

Proceedings of International Conference for High Performance Computing, Networking, Storage, and Analysis (SC 2020) (Internet), p.1318 - 1330, 2020/11

5次元ジャイロ運動論モデルに基づく次世代核融合実験炉ITERのマルチスケールfull-$$f$$シミュレーションは核融合科学において最も計算コストが大きい問題の一つである。本研究では、新しい混合精度省通信クリロフ法を用いてジャイロ運動論的トロイダル5次元オイラーコードGT5Dを高速化した。演算加速環境における大域的集団通信のボトルネックを省通信クリロフ法によって解決した。これに加えて、A64FXにおいて新たにサポートされたFP16SIMD演算を用いて設計された新しいFP16前処理により、反復(袖通信)の回数と計算コストの両方を削減した。富岳とSummitにおける1,440CPU/GPUを用いた1,000億格子のITER規模シミュレーションに対して、提案手法の処理性能は従来の非省通信クリロフ法に比べてそれぞれ2.8倍, 1.9倍高速化され、5,760CPU/GPUまで良好な強スケーリングを示した。

論文

Interactive in-situ steering and visualization of GPU-accelerated simulations using particle-based volume rendering

河村 拓馬; 長谷川 雄太; 井戸村 泰宏

Proceedings of Joint International Conference on Supercomputing in Nuclear Applications + Monte Carlo 2020 (SNA + MC 2020), p.187 - 192, 2020/10

汚染物質の大気拡散予測の実現に向けて、GPUスーパーコンピュータ(スパコン)向けに最適化された適合格子細分化(AMR)による流体シミュレーションが開発されており、その結果の対話的な可視化や計算パラメータのステアリング技術が必要とされている。本研究では、これまでに開発してきた構造格子向けの粒子ベースIn-situ可視化手法をAMR向けに拡張し、ファイルを介したIn-situ制御機構を利用して計算パラメータのIn-Situステアリングを可能にした。開発した手法をGPUプラットフォーム上で動作する都市部でのプルーム分散シミュレーションに結合し、膨大なパラメータスキャン無しにヒューマンインザループにより汚染源探索が可能なことを示した。

論文

Communication-avoiding Krylov solvers for extreme scale nuclear CFD simulations

井戸村 泰宏; 伊奈 拓也*; Ali, Y.*; 今村 俊幸*

Proceedings of Joint International Conference on Supercomputing in Nuclear Applications + Monte Carlo 2020 (SNA + MC 2020), p.225 - 230, 2020/10

ジャイロ運動論的トロイダル5次元オイラーコードGT5Dにおける半陰解法差分ソルバ向けに新しいFP16(半精度)前処理付き省通信型クリロフソルバを開発した。このソルバでは、大域的集団通信のボトルネックを省通信型クリロフ部分空間法を用いて解決し、FP16前処理を用いて収束特性を改善することで袖通信の回数を削減した。FP16前処理は演算子の物理特性に基づいて設計され、A64FXにおいて新たにサポートされたFP16SIMD演算を用いて実装された。本ソルバは富岳(A64FX)とSummit(V100)に移植され、JAEA-ICEX(Haswell)に比べてそれぞれ$$sim$$63倍, $$sim$$29倍のソケットあたり性能の向上を達成した。

論文

Ensemble wind simulations using a mesh-refined lattice Boltzmann method on GPU-accelerated systems

長谷川 雄太; 小野寺 直幸; 井戸村 泰宏

Proceedings of Joint International Conference on Supercomputing in Nuclear Applications + Monte Carlo 2020 (SNA + MC 2020), p.236 - 242, 2020/10

都市域の風況および汚染物質拡散は建造物や植生に強く影響されるため、従来のメソスケールモデルで記述することは困難である。この問題を解決するため、細分化格子ボルツマン法(LBM)を用いたGPUベースのCFDコードの開発を進めており、現在、数メートル解像度の汚染物質拡散のリアルタイム解析を実現している。しかし、このような高解像度のシミュレーションでは流れは極めて強い乱流状態にあり、計算結果は様々な計算条件の影響で大きく変化する。本研究では、このようなカオス状態のシミュレーションにおいて計算の信頼性を向上させるため、アンサンブル計算を実装し、不確かさの統計的評価を可能とした。開発したコードを用いてオクラホマシティにおける野外拡散実験JU2003の検証計算を行った。結果として、風況が実験とよく一致するとともに、トレーサガス濃度の平均値がアンサンブル計算と実験値の間でFactor2の条件(計算値と実験値の比が1/2から2倍の間にあること)を満たすことを確認した。

論文

GPU-acceleration of locally mesh allocated two phase flow solver for nuclear reactors

小野寺 直幸; 井戸村 泰宏; Ali, Y.*; 山下 晋; 下川辺 隆史*; 青木 尊之*

Proceedings of Joint International Conference on Supercomputing in Nuclear Applications + Monte Carlo 2020 (SNA + MC 2020), p.210 - 215, 2020/10

本研究では、ブロック型局所細分化(AMR)法に基づくPoisson解法のGPU高速化を実施した。ブロック型AMR法はGPUに適したデータ構造であり、複雑な構造物で構成された原子炉等の解析に必須な解析手法である。これに、最新の前処理手法であるマルチグリッド(MG)法を共役勾配(CG)法へと組み合わせることで、計算の高速化を実現した。MG-CG法を構成する計算カーネルをGPUスーパーコンピュータであるTSUBAME3.0上にて測定した結果、ベクトル-ベクトル和、行列-ベクトル積、およびドット積の帯域幅は、ピークパフォーマンスの約60%となり、良好なパフォーマンスを実現した。更に、MG法の前処理手法として、3段のVサイクル法および各段に対してRed-Black SOR法を適用した手法を用いて、$$453.0times10^6$$格子点の大規模問題の解析を実施した結果、元の前処理付きCG法と比較して、反復回数を30%未満に削減すると共に、2.5倍の計算の高速化を達成した。

論文

Estimation of air dose rate using measurement results of monitoring posts in Fukushima Prefecture

関 暁之; 真弓 明恵; Wainwright-Murakami, Haruko*; 斎藤 公明; 武宮 博; 井戸村 泰宏

Proceedings of Joint International Conference on Supercomputing in Nuclear Applications + Monte Carlo 2020 (SNA + MC 2020), p.158 - 164, 2020/10

空間線量率の時間変化を近くのモニタリングポストの測定結果を使って推定する手法を開発した。この手法は、対象地点のわずかな測定値と近くのモニタリングポストの高頻度な測定値から観測モデルを設定し、階層ベイズモデルによって推定するものである。この手法の妥当性を福島県内のモニタリングポストを対象に調査したところ、ほぼ全ての対象地点において誤差が10%以内で推定することができた。

論文

大規模多相流体解析向け省通信型マルチグリッド前処理付き共役勾配法

井戸村 泰宏; 小野寺 直幸; 山田 進; 山下 晋; 伊奈 拓也*; 今村 俊幸*

スーパーコンピューティングニュース, 22(5), p.18 - 29, 2020/09

多相多成分熱流動解析コードJUPITERの圧力ポアソン方程式に省通信型マルチグリッド前処理付き共役勾配(CAMGCG)法を適用し、従来のクリロフ部分空間法と計算性能と収束特性を比較した。CAMGCGソルバは問題サイズによらずロバーストな収束特性を示し、通信削減と収束特性向上を両立することから、通信削減のみを実現する省通信クリロフ部分空間法に対する優位性が高い。CAMGCGソルバを900億自由度の大規模多相流体解析に適用し、前処理付共役勾配法ソルバと処理性能を比較した。このベンチマークにおいて、反復回数は約1/800に削減され、Oakforest-PACS上で8,000ノードに至る良好な強スケーリングを維持しつつ約11.6倍の性能向上を達成した。

論文

Improvement in interactive remote in situ visualization using SIMD-aware function parser and asynchronous data I/O

河村 拓馬; 井戸村 泰宏

Journal of Visualization, 23(4), p.695 - 706, 2020/08

 被引用回数:0 パーセンタイル:0.01(Computer Science, Interdisciplinary Applications)

粒子ベースボリュームレンダリングに基づくIn-situ可視化システムは、多変量ボリュームレンダリングに基づく高度にスケーラブルで柔軟な視覚解析環境を提供する。従来のCPUプラットフォームでは優れた計算パフォーマンスを示したが、最新のメニーコアプラットフォームでの高速計算により、関数パーサーと粒子データI/Oに関連する性能のボトルネックが明らかになった。本論文では、新しいSIMD対応の関数パーサーと、タスクベースのスレッド並列化に基づく非同期データI/Oを開発する。8208基のIntel Xeon Phi7250 (Knights Landing)プロセッサーで構成されるOakforest-PACS上の数値実験では、強スケーリングを約100kコアに維持しながら、一桁高い処理速度を実証した。

論文

Self-organization of zonal flows and isotropic eddies in toroidal electron temperature gradient driven turbulence

河合 智賀*; 井戸村 泰宏; 小川 雄一*; 山田 弘司*

Physics of Plasmas, 27(8), p.082302_1 - 082302_11, 2020/08

 被引用回数:1 パーセンタイル:30.4(Physics, Fluids & Plasmas)

弱磁気シアにおける大域的ジャイロ運動論モデルに基づいてトロイダル電子温度勾配駆動(ETG)乱流を調べた。大域的分布効果のために高トロイダルモード数nのトロイダルETGモードは外側の磁気面で励起され、強い線形分散をもたらす。この結果得られる非等方な波-乱流境界とエネルギー逆カスケードが帯状流の自己組織化を生成する。これは大域的ジャイロ運動論モデル特有の機構である。この自己組織化はランダムノイズによって初期化した減衰乱流とトロイダルETG乱流の両方で確認された。また、イオン電子温度比と乱流強度が決める臨界パラメータによってこの自己組織化過程が帯状流と等方的渦を生成することも示した。

397 件中 1件目~20件目を表示