検索対象:     
報告書番号:
※ 半角英数字
 年 ~ 
 年
検索結果: 14 件中 1件目~14件目を表示
  • 1

発表形式

Initialising ...

選択項目を絞り込む

掲載資料名

Initialising ...

発表会議名

Initialising ...

筆頭著者名

Initialising ...

キーワード

Initialising ...

使用言語

Initialising ...

発行年

Initialising ...

開催年

Initialising ...

選択した検索結果をダウンロード

論文

格子ボルツマン法のアンサンブル計算に基づく汚染物質拡散解析

長谷川 雄太; 小野寺 直幸; 井戸村 泰宏

第34回数値流体力学シンポジウム講演論文集(インターネット), 3 Pages, 2020/12

都市風況および汚染物質拡散解析を行うため、局所細分化格子ボルツマン法を用いた実時間アンサンブル計算コードを開発した。開発したコードを、産業技術総合研究所による風洞実験、およびオクラホマシティでの野外拡散実験JU2003と比較した。風洞実験に対する検証では、風況は実験とよく一致するとともに、トレーサ物質の濃度は、環境アセスメントガイドラインで示されている評価指標であるFACTOR2に対し、61.2%の正答率を達成した。野外拡散実験JU2003においては、風速の瞬時値は実験とよく一致したが、風向は最大で100$$^{circ}$$のずれがあった。一方で、トレーサ物質濃度の平均値は、全時間区間においてFACTOR2を満たした。以上の結果より本コードは環境アセスメントに対して十分な精度を持つことを示した。

論文

Interactive in-situ steering and visualization of GPU-accelerated simulations using particle-based volume rendering

河村 拓馬; 長谷川 雄太; 井戸村 泰宏

Proceedings of Joint International Conference on Supercomputing in Nuclear Applications + Monte Carlo 2020 (SNA + MC 2020), p.187 - 192, 2020/10

汚染物質の大気拡散予測の実現に向けて、GPUスーパーコンピュータ(スパコン)向けに最適化された適合格子細分化(AMR)による流体シミュレーションが開発されており、その結果の対話的な可視化や計算パラメータのステアリング技術が必要とされている。本研究では、これまでに開発してきた構造格子向けの粒子ベースIn-situ可視化手法をAMR向けに拡張し、ファイルを介したIn-situ制御機構を利用して計算パラメータのIn-Situステアリングを可能にした。開発した手法をGPUプラットフォーム上で動作する都市部でのプルーム分散シミュレーションに結合し、膨大なパラメータスキャン無しにヒューマンインザループにより汚染源探索が可能なことを示した。

論文

Ensemble wind simulations using a mesh-refined lattice Boltzmann method on GPU-accelerated systems

長谷川 雄太; 小野寺 直幸; 井戸村 泰宏

Proceedings of Joint International Conference on Supercomputing in Nuclear Applications + Monte Carlo 2020 (SNA + MC 2020), p.236 - 242, 2020/10

都市域の風況および汚染物質拡散は建造物や植生に強く影響されるため、従来のメソスケールモデルで記述することは困難である。この問題を解決するため、細分化格子ボルツマン法(LBM)を用いたGPUベースのCFDコードの開発を進めており、現在、数メートル解像度の汚染物質拡散のリアルタイム解析を実現している。しかし、このような高解像度のシミュレーションでは流れは極めて強い乱流状態にあり、計算結果は様々な計算条件の影響で大きく変化する。本研究では、このようなカオス状態のシミュレーションにおいて計算の信頼性を向上させるため、アンサンブル計算を実装し、不確かさの統計的評価を可能とした。開発したコードを用いてオクラホマシティにおける野外拡散実験JU2003の検証計算を行った。結果として、風況が実験とよく一致するとともに、トレーサガス濃度の平均値がアンサンブル計算と実験値の間でFactor2の条件(計算値と実験値の比が1/2から2倍の間にあること)を満たすことを確認した。

論文

局所細分化格子ボルツマン法を用いたアンサンブル風況解析

長谷川 雄太; 小野寺 直幸; 井戸村 泰宏

第25回計算工学講演会論文集(CD-ROM), 4 Pages, 2020/06

都市部における風況と汚染物質拡散のアンサンブル計算を行うため、局所細分化格子ボルツマン法を用いたGPUペースのCFDコードを開発した。本コードはPascalまたはVolta世代のGPUアーキテクチャ向けに最適化されており、数km四方の計算領域・数m解像度の格子において実時間で風況解析を行うことができる。開発したコードを用いて、オクラホマシティで行われたフィールド実験JU(Joint Urban)2003の再現計算を行った。計算では、風況は実験値とよく一致し、また、トレーサ濃度のアンサンブルの平均値および最大値がFactor2(計算値と実験値の比が1/2倍$$sim$$2倍)の条件を満たすことを確認した。

論文

自転車競技の集団走行に対する大規模空力解析

青木 尊之*; 長谷川 雄太

自動車技術, 74(4), p.18 - 23, 2020/04

LESに基づくCFD計算を用いて自転車競技の空力解析を行った。単独での走行および2$$sim$$4人の集団走行では、算出された抗力は風洞実験と良く一致した。競合する2集団の走行について、集団内の選手の配置を複数検討した。72人の選手の集団走行として、GPUスーパコンピュータで22.3億格子を用いた大規模空力解析を実施した。

口頭

細分化格子LBMに基づくLESの複数GPUによるロードレースの空力計算

長谷川 雄太; 青木 尊之*; 小林 宏充*; 白崎 啓太*

no journal, , 

自転車のロードレースの空力解析のため、大規模LES計算を実装および実行する。複数GPU計算を行うため、コヒーレント構造スマゴリンスキーモデルを導入した細分化格子LBMを用いた。単体走行および4人の集団走行の検証計算は、既往研究の実験および計算の結果とよく一致した。大規模計算のベンチマークとして72人の自転車の集団の空力解析を実施し、192GPUを用いて4日で計算を完了した。この計算コストは、応用解析に対して十分実用的である。

口頭

Performance portability of large scale distributed Krylov solvers with OpenACC and CUDA

井戸村 泰宏; Ali, Y.*; 小野寺 直幸; 長谷川 雄太; 伊奈 拓也*

no journal, , 

大規模CFDシミュレーションにおいてクリロフソルバが全計算コストの約90%を占める。そのようなCFDコードを加速するために、前処理付共役勾配(PCG)法, 前処理付チェビシェフ基底省通信共役勾配(P-CBCG)法, 省通信一般化最小残差(CA-GMRES)法をGPU環境に移植した。本講演ではこれらのソルバをOpenACC, CUDA、および、CUDA aware MPIを用いて移植する上でのノウハウを議論する。

口頭

局所細分化格子ボルツマン法におけるGPU間相互接続技術を活用した高速化手法の検討

長谷川 雄太; 小野寺 直幸; 井戸村 泰宏

no journal, , 

局所細分化格子ボルツマン法の計算コードにおけるメモリ使用量削減および通信高速化を目的として、CUDAのUnified memoryを用いたノード内複数GPU実装を試行した。等間隔格子を用いたマイクロベンチマークテストでは、3次元拡散方程式において弱スケーリング96.4%および強スケーリング94.6%の並列化効率、ならびに、D3Q27格子ボルツマン法において弱スケーリング99.3%および強スケーリング56.5%の並列化効率を得た。局所細分化格子ボルツマン法においては、Flat MPI実装に比べてメモリ使用量を25.5%削減したが、並列化効率が9.0%と極めて低くなった。

口頭

格子ボルツマン法への適合細分化格子法の導入と複数GPU化のための諸実装

長谷川 雄太

no journal, , 

本研究では複雑形状物体周りの空力解析、ならびに都市域の局所風況解析を大規模LES計算で実現するため、適合細分化格子法を導入した格子ボルツマン法の複数GPU計算の実装を行ってきた。本発表では、開発コードの実装において行ってきた単一GPU計算の高速化、MPI実装における通信の最適化、最新のGPU環境におけるノード内複数GPU計算に特化した並列実装法といった、複数GPU計算に関わる種々の最適化手法について発表する。

口頭

Enhancing intra-node Multi-GPU stencil calculations on DGX-2 using concurrent-addressing with Unified Memory

長谷川 雄太; 小野寺 直幸; 井戸村 泰宏

no journal, , 

原子力機構におけるCityLBMプロジェクトでは、AMR(Adaptive mesh refinement; 適合細分化格子法)に基づく実時間都市風況予測コードの開発を行ってきた。次世代のCityLBMコードにおいては、予測の信頼性を向上するためにアンサンブル計算の導入が求められている。このためには、メモリ使用量を1つの計算あたり1ノードないし4$$sim$$16GPUの規模に抑える必要がある。本研究では、AMRコードにおけるメモリ使用量の削減およびデータ通信の高速化を目的として、CUDAのUnified Memoryを用いたイントラノード複数GPU計算の実装を試行した。Unified MemoryへのアクセスがHBM2(同一GPU)またはNVLink(隣接GPU)から自動的に判別されるため、比較的簡便に複数GPU計算を実装することができる。等間隔格子上で3次元拡散方程式および格子ボルツマン法の複数GPU計算コードを実装し、弱スケーリングおよび強スケーリングを測定することでNVLinkの性能テストを行った。

口頭

局所細分化格子ボルツマン法による都市部を対象とした局所風況解析のアンサンブル計算に向けた省メモリ実装

長谷川 雄太; 小野寺 直幸; 井戸村 泰宏

no journal, , 

建造物が密集する都市部における汚染物質拡散予測を実現するため、GPUで高速に計算できる格子ボルツマン法に基づく風況解析コードCityLBMの開発を行っている。本発表では、CityLBMコードの省メモリ実装として、MPIバッファサイズの最適化、および建物内部や起伏のある地形の地下領域の格子をメモリ確保しないことによる格子点数の削減を行った。また、アンサンブル計算を行うため、MPIコミュニケータを分割し、1つのmpirunで全てのアンサンブルメンバーを管理するコードを実装した。本コードにてオクラホマシティでの野外トレーサー拡散実験を対象としたアンサンブル計算を行い、1ケースの計算では実験値と一致しなかった計算結果が、アンサンブル計算のばらつきの範囲で一致することを確認した。これにより、アンサンブル計算によって汚染物質拡散予測解析の信頼性を向上できることを示した。

口頭

粒子ベースIn-Situ可視化フレームワークを利用したファイルベース制御による対話的In-Situステアリング

河村 拓馬; 長谷川 雄太

no journal, , 

スーパーコンピュータ上の膨大な資源を利用して長時間実行される大規模計算では、計算パラメータ調整に伴う再計算を繰り返し実行することが困難である。我々は粒子ベースボリュームレンダリングを利用したIn-Situ可視化フレームワーク上で、ファイルベース制御による計算パラメータの対話的な操作技術を開発し、GPUクラスタ上の流体計算に適用して対話的可視化・パラメータ操作が可能なことを確認した。

口頭

Ensemble simulation for micro-meteorological wind condition using locally-mesh refined lattice Boltzmann method

長谷川 雄太; 小野寺 直幸; 井戸村 泰宏

no journal, , 

都市域における汚染物質拡散予測を行うため、風況計算コードCityLBMの開発を行っている。CityLBMは局所細分化格子ボルツマン法を用いており、低高度において格子を細分化することで地表面付近の乱流を捉え、かつ、GPUを用いることで1m程度の解像度において実時間解析を達成している。本研究では、オクラホマシティにおける野外拡散実験JU2003を対象として、アンサンブル数100、および4096m$$times$$4096m(水平方向)$$times$$2560m(高さ方向)の計算領域に対して地表面付近の格子解像度を4mとした細分化格子を設定し、アンサンブル計算の検証を行った。アンサンブル計算と野外実験の結果を比較すると、風速は平均から1$$sigma$$の範囲でよく一致し(ただし$$sigma$$はアンサンブル計算の標準偏差)、かつ、トレーサ物質の濃度の平均値はFACTOR2の条件を満たした。

口頭

Multigrid Poisson solver for a block-structured adaptive mesh refinement method on CPU and GPU supercomputers

小野寺 直幸; 井戸村 泰宏; 朝比 祐一; 長谷川 雄太; 下川辺 隆史*; 青木 尊之*

no journal, , 

本研究では、CPUおよびGPUスーパーコンピュータで動作するブロック型適合細分化格子に基づくポアソン解法を開発した。ブロック型適合細分化格子法は、複雑な構造物で構成される原子炉等のCFD解析に対して、有効である。前処理手法として、3段VサイクルMG法を実装するとともに、混合精度を用いて計算を高速化した。TSUBAMEのGPUを用いた計算にて、$$4.53 times 10^8$$格子の大規模問題に対して、提案した手法はオリジナルの前提条件付きCG法と比較して、反復回数を30%以下に削減し、2倍の高速化を達成した。この研究成果は、CPUやGPU等のそれぞれの計算機での堅牢性,計算精度,スレッド並列化,キャッシュサイズなどを議論する上で有用である。

14 件中 1件目~14件目を表示
  • 1