検索対象:     
報告書番号:
※ 半角英数字
 年 ~ 
 年
検索結果: 66 件中 1件目~20件目を表示

発表形式

Initialising ...

選択項目を絞り込む

掲載資料名

Initialising ...

発表会議名

Initialising ...

筆頭著者名

Initialising ...

キーワード

Initialising ...

使用言語

Initialising ...

発行年

Initialising ...

開催年

Initialising ...

選択した検索結果をダウンロード

論文

Real-time tracer dispersion simulations in Oklahoma City using the locally mesh-refined lattice Boltzmann method

小野寺 直幸; 井戸村 泰宏; 長谷川 雄太; 中山 浩成; 下川辺 隆史*; 青木 尊之*

Boundary-Layer Meteorology, 179(2), p.187 - 208, 2021/05

 被引用回数:2 パーセンタイル:89.67(Meteorology & Atmospheric Sciences)

汚染物質の拡散解析手法CityLBMは、GPUスーパーコンピュータ上において、適合細分化格子(AMR)法を適用する事で、数kmの解析領域の実時間解析が可能である。本論文では、CityLBMの検証としてオクラホマ市で実施された野外拡散実験(JU2003)に対する解析を実施した。計算条件として、Weather Research and Forecasting(WRF)モデルを用いた風況条件および、建物と植生を考慮した地表面データをCityLBMに与えることで、JU2003の実験条件を再現した。さらにアンサンブル計算の実施により、乱流の不確実性を軽減した。汚染物質の時間平均濃度および最大値を実験測定値と比較した結果、アンサンブル計算により解析精度を向上すると共に、2m解像度・4km四方の解析では、24個の計測値に対して70%の高い割合でFactor2を満たす事を確認した。

論文

木構造に基づく細分化格子LBMにおける領域分割法の改善

長谷川 雄太; 青木 尊之*; 小林 宏充*; 井戸村 泰宏; 小野寺 直幸

計算工学講演会論文集(CD-ROM), 26, 6 Pages, 2021/05

Forest-of-octreesに基づく局所格子細分化法(LMR)を導入した格子ボルツマン法(LBM)に基づく空力解析コードに対し、挿し木法による領域分割の改善手法を提案した。従来の空間充填曲線に基づく領域分割法は、適合格子細分化法(AMR)やLMRで広く用いられているものの、GPUスパコン向けに実装された本空力解析コードにおいては袖領域通信が増大し計算のボトルネックとなるうることが確認された。本研究で提案する挿し木法は、粗い等間隔格子状の領域分割と細かい空間充填曲線に基づく分割のハイブリッドによる手法である。挿し木法により、領域分割の局所性と幾何形状が改善しており、通信量が従来の空間充填曲線に基づく手法に比べて3分の1に削減された。8GPU並列による性能検証では、コード全体で1.23倍の高速化が確認された。また、強スケーリングにおいてさらに性能の改善が見られ、128GPUの強スケーリングにおいては、従来手法に比べて1.82倍の高速化を示し、2207MLUPS (mega-lattice update per second)の計算性能を達成した。

論文

ブロック型適合細分化格子でのPoisson解法の混合精度演算による高速化

小野寺 直幸; 井戸村 泰宏; 長谷川 雄太; 下川辺 隆史*; 青木 尊之*

計算工学講演会論文集(CD-ROM), 26, 3 Pages, 2021/05

本研究では、二相流体解析コードJUPITER-AMRに対して、圧力ポアソン方程式に対する混合精度前処理手法を開発した。マルチグリッド前処理手法として、3段のVサイクルの幾何学的MG法およびキャッシュを再利用したSOR(CR-SOR)法を適用した。原子力工学問題での性能測定として、バンドル体系に対する多相流体解析を実施した。計算速度として、単精度演算を適用する事で、倍精度演算の75%へと削減すると共に、強スケーリング性能においては、32台から96台のGPUを利用する事で1.88倍を実現した。

論文

機械学習による細分化格子に基づく二次元定常流予測

朝比 祐一; 畑山 そら*; 下川辺 隆史*; 小野寺 直幸; 長谷川 雄太; 井戸村 泰宏

計算工学講演会論文集(CD-ROM), 26, 4 Pages, 2021/05

多重解像度の定常流流れ場を符合付き距離関数から予測するConvolutional Neural networkモデルを開発した。高解像度の画像生成を可能とするネットワークPix2PixHDをパッチ化された高解像度データに適用することで、通常のPix2PixHDよりメモリ使用量を削減しつつ、高解像度流れ場の予測が可能であることを示した。

論文

GPU acceleration of multigrid preconditioned conjugate gradient solver on block-structured Cartesian grid

小野寺 直幸; 井戸村 泰宏; 長谷川 雄太; 山下 晋; 下川辺 隆史*; 青木 尊之*

Proceedings of International Conference on High Performance Computing in Asia-Pacific Region (HPC Asia 2021) (Internet), p.120 - 128, 2021/01

 被引用回数:0 パーセンタイル:0.01

本研究では、二相流体解析コードJUPITERに対して、マルチグリッド前処理付き共役勾配(MG-CG)法を開発した。MG法は、3段のVサイクルMG法に基づいて構築し、各段に対して、RB-SOR法およびGPUのキャッシュを再利用したCR-SORを開発・適用した。性能測定として、バンドル体系に対する気液二相流体解析を行った。RB-SOR法およびCR-SOR法を適用したMG-CG法では、MG法を適用しないPCG法と比較して、収束までの反復回数を15%と9%以下に削減するとともに、3.1倍, 5.9倍の計算速度が達成された。以上の結果から、本研究で開発したMG-CG法は、GPUを用いたスーパーコンピュータ上にて、効率的に大規模な二相流体解析が可能であることが示された。

論文

格子ボルツマン法のアンサンブル計算に基づく汚染物質拡散解析

長谷川 雄太; 小野寺 直幸; 井戸村 泰宏

第34回数値流体力学シンポジウム講演論文集(インターネット), 3 Pages, 2020/12

都市風況および汚染物質拡散解析を行うため、局所細分化格子ボルツマン法を用いた実時間アンサンブル計算コードを開発した。開発したコードを、産業技術総合研究所による風洞実験、およびオクラホマシティでの野外拡散実験JU2003と比較した。風洞実験に対する検証では、風況は実験とよく一致するとともに、トレーサ物質の濃度は、環境アセスメントガイドラインで示されている評価指標であるFACTOR2に対し、61.2%の正答率を達成した。野外拡散実験JU2003においては、風速の瞬時値は実験とよく一致したが、風向は最大で100$$^{circ}$$のずれがあった。一方で、トレーサ物質濃度の平均値は、全時間区間においてFACTOR2を満たした。以上の結果より本コードは環境アセスメントに対して十分な精度を持つことを示した。

論文

ブロック型適合細分化格子でのPoisson解法のGPU・CPU・ARMプロセッサに対する性能測定

小野寺 直幸; 井戸村 泰宏; 朝比 祐一; 長谷川 雄太; 下川辺 隆史*; 青木 尊之*

第34回数値流体力学シンポジウム講演論文集(インターネット), 2 Pages, 2020/12

本研究では、二相流体解析コードJUPITERにおいて、圧力ポアソン方程式に対するマルチグリッド前提共役勾配(MG-CG)ソルバーを開発した。プログラムの開発言語として、C++およびCUDAを用いることで、様々なコンピュータプラットフォームに対応した。CG解法の主な計算カーネルは、GPU, CPU、およびARM上において、ルーフライン性能の0.4$$sim$$0.75と妥当な性能を達成した。一方で、SpMVカーネルでは、ARM上において、大幅な性能劣化が確認された。その原因を調査したところ、SpMVカーネル内にて関数呼び出しを行うことで、コンパイラの最適化が働かないことが確認された。

論文

Ensemble wind simulations using a mesh-refined lattice Boltzmann method on GPU-accelerated systems

長谷川 雄太; 小野寺 直幸; 井戸村 泰宏

Proceedings of Joint International Conference on Supercomputing in Nuclear Applications + Monte Carlo 2020 (SNA + MC 2020), p.236 - 242, 2020/10

都市域の風況および汚染物質拡散は建造物や植生に強く影響されるため、従来のメソスケールモデルで記述することは困難である。この問題を解決するため、細分化格子ボルツマン法(LBM)を用いたGPUベースのCFDコードの開発を進めており、現在、数メートル解像度の汚染物質拡散のリアルタイム解析を実現している。しかし、このような高解像度のシミュレーションでは流れは極めて強い乱流状態にあり、計算結果は様々な計算条件の影響で大きく変化する。本研究では、このようなカオス状態のシミュレーションにおいて計算の信頼性を向上させるため、アンサンブル計算を実装し、不確かさの統計的評価を可能とした。開発したコードを用いてオクラホマシティにおける野外拡散実験JU2003の検証計算を行った。結果として、風況が実験とよく一致するとともに、トレーサガス濃度の平均値がアンサンブル計算と実験値の間でFactor2の条件(計算値と実験値の比が1/2から2倍の間にあること)を満たすことを確認した。

論文

GPU-acceleration of locally mesh allocated two phase flow solver for nuclear reactors

小野寺 直幸; 井戸村 泰宏; Ali, Y.*; 山下 晋; 下川辺 隆史*; 青木 尊之*

Proceedings of Joint International Conference on Supercomputing in Nuclear Applications + Monte Carlo 2020 (SNA + MC 2020), p.210 - 215, 2020/10

本研究では、ブロック型局所細分化(AMR)法に基づくPoisson解法のGPU高速化を実施した。ブロック型AMR法はGPUに適したデータ構造であり、複雑な構造物で構成された原子炉等の解析に必須な解析手法である。これに、最新の前処理手法であるマルチグリッド(MG)法を共役勾配(CG)法へと組み合わせることで、計算の高速化を実現した。MG-CG法を構成する計算カーネルをGPUスーパーコンピュータであるTSUBAME3.0上にて測定した結果、ベクトル-ベクトル和、行列-ベクトル積、およびドット積の帯域幅は、ピークパフォーマンスの約60%となり、良好なパフォーマンスを実現した。更に、MG法の前処理手法として、3段のVサイクル法および各段に対してRed-Black SOR法を適用した手法を用いて、$$453.0times10^6$$格子点の大規模問題の解析を実施した結果、元の前処理付きCG法と比較して、反復回数を30%未満に削減すると共に、2.5倍の計算の高速化を達成した。

論文

大規模多相流体解析向け省通信型マルチグリッド前処理付き共役勾配法

井戸村 泰宏; 小野寺 直幸; 山田 進; 山下 晋; 伊奈 拓也*; 今村 俊幸*

スーパーコンピューティングニュース, 22(5), p.18 - 29, 2020/09

多相多成分熱流動解析コードJUPITERの圧力ポアソン方程式に省通信型マルチグリッド前処理付き共役勾配(CAMGCG)法を適用し、従来のクリロフ部分空間法と計算性能と収束特性を比較した。CAMGCGソルバは問題サイズによらずロバーストな収束特性を示し、通信削減と収束特性向上を両立することから、通信削減のみを実現する省通信クリロフ部分空間法に対する優位性が高い。CAMGCGソルバを900億自由度の大規模多相流体解析に適用し、前処理付共役勾配法ソルバと処理性能を比較した。このベンチマークにおいて、反復回数は約1/800に削減され、Oakforest-PACS上で8,000ノードに至る良好な強スケーリングを維持しつつ約11.6倍の性能向上を達成した。

論文

局所細分化格子ボルツマン法を用いたアンサンブル風況解析

長谷川 雄太; 小野寺 直幸; 井戸村 泰宏

計算工学講演会論文集(CD-ROM), 25, 4 Pages, 2020/06

都市部における風況と汚染物質拡散のアンサンブル計算を行うため、局所細分化格子ボルツマン法を用いたGPUペースのCFDコードを開発した。本コードはPascalまたはVolta世代のGPUアーキテクチャ向けに最適化されており、数km四方の計算領域・数m解像度の格子において実時間で風況解析を行うことができる。開発したコードを用いて、オクラホマシティで行われたフィールド実験JU(Joint Urban)2003の再現計算を行った。計算では、風況は実験値とよく一致し、また、トレーサ濃度のアンサンブルの平均値および最大値がFactor2(計算値と実験値の比が1/2倍$$sim$$2倍)の条件を満たすことを確認した。

論文

ブロック型適合細分化格子でのPoisson解法のGPU高速化

小野寺 直幸; 井戸村 泰宏; Ali, Y.*; 下川辺 隆史*; 青木 尊之*

計算工学講演会論文集(CD-ROM), 25, 4 Pages, 2020/06

原子力機構では3次元多相流体解析手法としてJUPITERを開発している。本研究では、JUPITERの圧力Poisson方程式解法として、適合細分化格子(AMR)を用いたマルチグリッド前提条件付き共役勾配法(P-CG)を開発した。計算の高速化として、全ての計算カーネルはCUDAを用いて実装すると共に、GPUスーパーコンピュータ上にて高い性能を発揮する様に最適化した。開発したマルチグリッド圧力Poisson解法は、オリジナルのP-CG法と比較して約1/7の反復回数で収束することが確認された。また、TSUBAME3.0上で8から216GPUまでの強スケーリング性能測定により、更なる3倍の高速化が達成された。

論文

Locally mesh-refined lattice Boltzmann method for fuel debris air cooling analysis on GPU supercomputer

小野寺 直幸; 井戸村 泰宏; 上澤 伸一郎; 山下 晋; 吉田 啓之

Mechanical Engineering Journal (Internet), 7(3), p.19-00531_1 - 19-00531_10, 2020/06

福島第一原子力発電所の廃炉の方法の一つとして、空気のみで冷却する乾式法が挙げられる。日本原子力研究開発機構(JAEA)では、空冷性能のCFD評価手法としてJUPITERコードを開発している。しかしながら、JUPITERコードにおいて、複雑な原子炉内構造物を捉えた解析を実施するためには、非常の多くの計算資源が必要となる。このような問題に対して、本研究ではGPUスーパーコンピュータおよび適合格子細分化(AMR)法を適用した格子ボルツマン法に基づくCityLBMコードを開発している。CityLBMにて乾式法を模擬したJAEAの実験に対して検証計算を行なった結果、AMR格子の一様格子への収束性、および、実験値の再現を確認した。同じ解像度および同数の並列数にて計算速度の比較を行った結果、4台のGPU(NVIDIA Tesla V100)を用いたCityLBM法は、36台のCPU(Intel Xeon E5-2680v3)を用いたJUPITERの6.7倍の速度にて解析が可能であることが示された。

論文

Inner and outer-layer similarity of the turbulence intensity profile over a realistic urban geometry

稲垣 厚至*; Wangsaputra, Y.*; 神田 学*; Y$"u$cel, M.*; 小野寺 直幸; 青木 尊之*

SOLA (Scientific Online Letters on the Atmosphere) (Internet), 16, p.120 - 124, 2020/00

 被引用回数:0 パーセンタイル:0.01(Meteorology & Atmospheric Sciences)

都市境界層を対象とした風況解析により、内層および外層のスケーリングと乱流強度分布の類似性を検討した。計算条件として、現実的な建物形状の上に発達する中立条件を仮定すると共に、計算領域19.2km$$times$$4.8km$$times$$高さ1kmに対して2m格子を設定した。乱流強度分布は計算領域内で局所的に定義できる。内層と外層に対してスケーリング則を当てはめることで、表面形状に関係なく、内層と外層内の乱流強度予測のばらつきを減らすことが可能となる。スケーリングされたプロファイル間のばらつきは、各層のスケーリングパラメーターの不一致に起因するが、長さまたは速度の比率からなる無次元パラメーターを導入することで、それらの類似性を示した。

論文

GPU acceleration of communication avoiding Chebyshev basis conjugate gradient solver for multiphase CFD simulations

Ali, Y.*; 小野寺 直幸; 井戸村 泰宏; 伊奈 拓也*; 今村 俊幸*

Proceedings of 10th Workshop on Latest Advances in Scalable Algorithms for Large-Scale Systems (ScalA 2019), p.1 - 8, 2019/11

 被引用回数:6 パーセンタイル:99.23

大規模線形問題の反復法ソルバはCFDコードで共通に用いられる。前処理付共役勾配(P-CG)法は最も広く用いられている反復法の一つである。しかしながら、P-CG法では、特に演算加速環境において、大域的集団通信が重要なボトルネックとなる。この問題を解決するために、省通信版のP-CG法がますます重要になっている。本論文では多相CFDコードJUPITERにおけるP-CG法と前処理付チェビシェフ基底省通信CG(P-CBCG)法を最新のV100GPUに移植する。全てのGPUカーネルは高度に最適化され約90%のルーフライン性能を達成し、ブロックヤコビ前処理はGPUの高い演算性能を引き出すように再設計し、さらに残された袖通信のボトルネックは通信と計算のオーバーラップによって回避した。P-CG法とP-CBCG法の全体性能は大域的集団通信と袖通信の省通信特性によって左右され、GPUあたりのノード間通信帯域が重要となることが示された。開発したGPUソルバはKNLにおける以前のCPUソルバの2倍に加速され、Summitにおいて7,680GPUまで良好な強スケーリングを達成した。

論文

Development of a structured overset Navier-Stokes solver with a moving grid and full multigrid method

大橋 訓英*; 日野 孝則*; 小林 寛*; 小野寺 直幸; 坂本 信晶*

Journal of Marine Science and Technology, 24(3), p.884 - 901, 2019/09

 被引用回数:4 パーセンタイル:60.91(Engineering, Marine)

船舶の運動解析に向けて、移動重合格子に対して非定常レイノルズ平均モデルによる解析手法を構築した。解析手法の定式化として、圧力と速度の連成は弱圧縮性近似による手法を採用するとともに、複雑な船体運動は格子変形手法および対流項補正によって実現している。本研究では、マルチグリッド法による圧力Poisson方程式の解法を導入することで計算の高速化を実現した。重合格子に対する複雑なマルチグリッド法においても、各解像度および重合格子の接続情報に従って圧力の修正を行うことで、連続の式を満足している。以上の解析手法により、定常波を含む船舶周りの流れの計算が実現された。

論文

Fuel debris' air cooling analysis using a lattice Boltzmann method

小野寺 直幸; 井戸村 泰宏; 河村 拓馬; 上澤 伸一郎; 山下 晋; 吉田 啓之

Proceedings of 27th International Conference on Nuclear Engineering (ICONE-27) (Internet), 6 Pages, 2019/05

福島第一原子力発電所の廃炉の方法の一つとして、乾式法が挙げられる。日本原子力研究開発機構(JAEA)では、空冷性能のCFD評価手法としてJUPITERコードを開発している。しかしながら、JUPITERコードにおいて、複雑な原子炉内構造物を捉えた解析を実施するためには、非常の多くの計算資源と計算時間が必要となる。このような問題に対して、本研究ではGPUスーパーコンピュータに適した格子ボルツマン法に基づくCityLBMコードを開発している。CityLBMにてDry methodを模擬したJAEAの実験に対して検証計算を行なった結果、JUPITERコードと同様の結果が得られることが示された。また、同じ解像度および同数の並列数にて計算速度の比較を行った結果、GPUを用いたCityLBM法は、CPUを用いたJUPITERの1/6の計算時間にて解析が行えることが示された。以上の結果より、CityLBMは熱流動解析コードの有効な手法の一つであることが示された。

論文

Communication Reduced Multi-time-step Algorithm for Real-time Wind Simulation on GPU-based Supercomputers

小野寺 直幸; 井戸村 泰宏; Ali, Y.*; 下川辺 隆史*

Proceedings of 9th Workshop on Latest Advances in Scalable Algorithms for Large-Scale Systems (ScalA 2018) (Internet), p.9 - 16, 2018/11

 被引用回数:5 パーセンタイル:94.99

計算の高速化に向けて適合細分化格子(AMR)法を適用した格子ボルツマン法(LBM)に対して、通信削減マルチタイムステップ法(CRMT)を提案した。本手法はテンポラルブロッキング法に基づく定式化を行うことで、GPU計算で大きなボトルネックとなる通信回数の削減が可能となる。東京工業大学のTSUBAMEおよび東京大学のReedbushスーパーコンピュータにて性能測定を実施した結果、通信コストが64%に削減され、200GPUまでの弱および強スケーリング結果が改善された。以上の高速化により、2km四方の計算領域に対して1m解像度の風速5msの実時間解析が可能であることが示された。

論文

Communication avoiding multigrid preconditioned conjugate gradient method for extreme scale multiphase CFD simulations

井戸村 泰宏; 伊奈 拓也*; 山下 晋; 小野寺 直幸; 山田 進; 今村 俊幸*

Proceedings of 9th Workshop on Latest Advances in Scalable Algorithms for Large-Scale Systems (ScalA 2018) (Internet), p.17 - 24, 2018/11

 被引用回数:2 パーセンタイル:77.89

多相流体CFDコードJUPITERの圧力ポアソン方程式に省通信マルチグリッド前処理付共役勾配(CAMGCG)法を適用し、省通信クリロフ部分空間法と計算性能と収束特性を比較した。JUPITERコードにおいてCAMGCGソルバ問題サイズによらずロバーストな収束特性を有し、通信削減と収束特性向上を両立することから、通信削減のみを実現する省通信クリロフ部分空間法に対する優位性が高い。CAMGCGソルバを$$sim 900$$億自由度の大規模多相流体CFDシミュレーションに適用して反復回数を前処理付CG法の$$sim 1/800$$に削減し、Oakforest-PACSにおける8,000ノードまでの良好な強スケーリングとCG法の$$sim 11.6$$倍の性能向上を達成した。

論文

Acceleration of plume dispersion simulation using locally mesh-refined lattice Boltzmann method

小野寺 直幸; 井戸村 泰宏

Proceedings of 26th International Conference on Nuclear Engineering (ICONE-26) (Internet), 7 Pages, 2018/07

放射性物質の拡散計算は、核セキュリティの観点から非常に重要である。近年、低消費電力および演算性能の高さよりGPUによる科学技術計算が注目されている。本研究では、GPUを用いた格子ボルツマン法による計算コード手法を構築することで、高精度かつ高速な風況解析手法を構築した。東京工業大学のスーパーコンピュータTSUBAMEによる弱スケーリングの性能測定を行った結果、4から144台のGPUに対して良いスケーリングが得られるとともに、CPUとの比較ではノードあたり30倍程度の性能を達成した。産業技術総合研究所の風洞実験に対する検証計算では、AMR法を適用することで全てを細かい格子で計算するのと比較して10%程度の格子点数で解析が可能となるとともに、実験による観測と良く一致している結果が得られた。

66 件中 1件目~20件目を表示