検索対象:     
報告書番号:
※ 半角英数字
 年 ~ 
 年
検索結果: 36 件中 1件目~20件目を表示

発表形式

Initialising ...

選択項目を絞り込む

掲載資料名

Initialising ...

発表会議名

Initialising ...

筆頭著者名

Initialising ...

キーワード

Initialising ...

使用言語

Initialising ...

発行年

Initialising ...

開催年

Initialising ...

選択した検索結果をダウンロード

論文

CityTransformer; A Transformer-based model for contaminant dispersion prediction in a realistic urban area

朝比 祐一; 小野寺 直幸; 長谷川 雄太; 下川辺 隆史*; 芝 隼人*; 井戸村 泰宏

Boundary-Layer Meteorology, 186(3), p.659 - 692, 2023/03

 被引用回数:0 パーセンタイル:0.01(Meteorology & Atmospheric Sciences)

定点観測された風向などの時系列データおよび汚染物質放出点を入力として、汚染物質の地表面拡散分布を予測する機械学習モデルを開発した。問題設定としては、一様風が都市部へ流入し、都市部内にランダムに設置された汚染物質放出点から汚染物質が拡散するという状況を扱っている。機械学習モデルとしては、汚染物質放出点から汚染物質の拡散分布を予測するCNNモデルを用いた。風向などの時系列データは、Transformerや多層パーセプトロンによってEncodeし、CNNへと引き渡す。これによって、現実的に取得可能な定点測時系列データのみを入力とし、実用上価値の高い汚染物質の地表面拡散分布の予測を可能とした。同一のモデルを用いて定点観測時系列データから汚染物質放出点の予測が可能であることも示した。

論文

適合細分化格子ボルツマン法による大気境界層生成のためのパラメータ最適化

小野寺 直幸; 井戸村 泰宏; 長谷川 雄太; 下川辺 隆史*; 青木 尊之*

計算工学講演会論文集(CD-ROM), 27, 4 Pages, 2022/06

我々の研究グループでは、風況デジタルツインの実現に向けて、風況解析コードCityLBMを開発している。CityLBMは、計算領域周辺の境界条件をメソスケール気象データに同化させるナッジング法を導入することで、現実の風況を反映した解析が可能である。しかしながら、従来のナッジング法では、ナッジング係数が一定のため、大気状態が変化するような長時間解析の乱流強度を再現できない問題点が挙げられる。そこで、本研究では、パーティクルフィルタを用いた動的なナッジング・パラメータの最適化手法を提案する。CityLBMの検証として、米国オクラホマシティの風況実験に対する解析を実施した。シミュレーションと観測のそれぞれで得られる乱流強度の誤差を低減するようにナッジング係数を更新した結果、シミュレーションにおいて終日の大気境界層を再現できることを確認した。

論文

適合細分化格子ボルツマン法に基づく都市風況解析コードのNVIDIA及びAMDのGPUにおける性能移植性評価

朝比 祐一; 小野寺 直幸; 長谷川 雄太; 下川辺 隆史*; 芝 隼人*; 井戸村 泰宏

計算工学講演会論文集(CD-ROM), 27, 5 Pages, 2022/06

都市風況解析コードCityLBMをAMD社のMI100 GPUへと移植し、CityLBMの性能をNVIDIA P100, V100, A100およびAMD MI100において測定した。ホスト間でのMPI通信を利用した場合、CityLBMの性能はMI100においてV100と比べ20%程度向上した。適合細分化格子法に起因する補間カーネルを除く演算カーネルでは、MI100においてV100と比べ性能向上を確認した。

論文

AMR-Net: Convolutional neural networks for multi-resolution steady flow prediction

朝比 祐一; 畑山 そら*; 下川辺 隆史*; 小野寺 直幸; 長谷川 雄太; 井戸村 泰宏

Proceedings of 2021 IEEE International Conference on Cluster Computing (IEEE Cluster 2021) (Internet), p.686 - 691, 2021/10

 被引用回数:2 パーセンタイル:72.38(Computer Science, Hardware & Architecture)

多重解像度の定常流を予測する畳み込みニューラルネットワークを開発した。本モデルは、最先端の画像変換モデルpix2pixHDに基づき、パッチ化された符合付き距離関数から高解像度の流れ場の予測が可能である。高解像度データをパッチ化することにより、pix2pixHDと比べてメモリ使用量を削減した。

論文

Real-time tracer dispersion simulations in Oklahoma City using the locally mesh-refined lattice Boltzmann method

小野寺 直幸; 井戸村 泰宏; 長谷川 雄太; 中山 浩成; 下川辺 隆史*; 青木 尊之*

Boundary-Layer Meteorology, 179(2), p.187 - 208, 2021/05

 被引用回数:12 パーセンタイル:75.33(Meteorology & Atmospheric Sciences)

汚染物質の拡散解析手法CityLBMは、GPUスーパーコンピュータ上において、適合細分化格子(AMR)法を適用する事で、数kmの解析領域の実時間解析が可能である。本論文では、CityLBMの検証としてオクラホマ市で実施された野外拡散実験(JU2003)に対する解析を実施した。計算条件として、Weather Research and Forecasting(WRF)モデルを用いた風況条件および、建物と植生を考慮した地表面データをCityLBMに与えることで、JU2003の実験条件を再現した。さらにアンサンブル計算の実施により、乱流の不確実性を軽減した。汚染物質の時間平均濃度および最大値を実験測定値と比較した結果、アンサンブル計算により解析精度を向上すると共に、2m解像度・4km四方の解析では、24個の計測値に対して70%の高い割合でFactor2を満たす事を確認した。

論文

ブロック型適合細分化格子でのPoisson解法の混合精度演算による高速化

小野寺 直幸; 井戸村 泰宏; 長谷川 雄太; 下川辺 隆史*; 青木 尊之*

計算工学講演会論文集(CD-ROM), 26, 3 Pages, 2021/05

本研究では、二相流体解析コードJUPITER-AMRに対して、圧力ポアソン方程式に対する混合精度前処理手法を開発した。マルチグリッド前処理手法として、3段のVサイクルの幾何学的MG法およびキャッシュを再利用したSOR(CR-SOR)法を適用した。原子力工学問題での性能測定として、バンドル体系に対する多相流体解析を実施した。計算速度として、単精度演算を適用する事で、倍精度演算の75%へと削減すると共に、強スケーリング性能においては、32台から96台のGPUを利用する事で1.88倍を実現した。

論文

機械学習による細分化格子に基づく二次元定常流予測

朝比 祐一; 畑山 そら*; 下川辺 隆史*; 小野寺 直幸; 長谷川 雄太; 井戸村 泰宏

計算工学講演会論文集(CD-ROM), 26, 4 Pages, 2021/05

多重解像度の定常流流れ場を符合付き距離関数から予測するConvolutional Neural networkモデルを開発した。高解像度の画像生成を可能とするネットワークPix2PixHDをパッチ化された高解像度データに適用することで、通常のPix2PixHDよりメモリ使用量を削減しつつ、高解像度流れ場の予測が可能であることを示した。

論文

GPU acceleration of multigrid preconditioned conjugate gradient solver on block-structured Cartesian grid

小野寺 直幸; 井戸村 泰宏; 長谷川 雄太; 山下 晋; 下川辺 隆史*; 青木 尊之*

Proceedings of International Conference on High Performance Computing in Asia-Pacific Region (HPC Asia 2021) (Internet), p.120 - 128, 2021/01

 被引用回数:0 パーセンタイル:0.01(Computer Science, Hardware & Architecture)

本研究では、二相流体解析コードJUPITERに対して、マルチグリッド前処理付き共役勾配(MG-CG)法を開発した。MG法は、3段のVサイクルMG法に基づいて構築し、各段に対して、RB-SOR法およびGPUのキャッシュを再利用したCR-SORを開発・適用した。性能測定として、バンドル体系に対する気液二相流体解析を行った。RB-SOR法およびCR-SOR法を適用したMG-CG法では、MG法を適用しないPCG法と比較して、収束までの反復回数を15%と9%以下に削減するとともに、3.1倍, 5.9倍の計算速度が達成された。以上の結果から、本研究で開発したMG-CG法は、GPUを用いたスーパーコンピュータ上にて、効率的に大規模な二相流体解析が可能であることが示された。

論文

ブロック型適合細分化格子でのPoisson解法のGPU・CPU・ARMプロセッサに対する性能測定

小野寺 直幸; 井戸村 泰宏; 朝比 祐一; 長谷川 雄太; 下川辺 隆史*; 青木 尊之*

第34回数値流体力学シンポジウム講演論文集(インターネット), 2 Pages, 2020/12

本研究では、二相流体解析コードJUPITERにおいて、圧力ポアソン方程式に対するマルチグリッド前提共役勾配(MG-CG)ソルバーを開発した。プログラムの開発言語として、C++およびCUDAを用いることで、様々なコンピュータプラットフォームに対応した。CG解法の主な計算カーネルは、GPU, CPU、およびARM上において、ルーフライン性能の0.4$$sim$$0.75と妥当な性能を達成した。一方で、SpMVカーネルでは、ARM上において、大幅な性能劣化が確認された。その原因を調査したところ、SpMVカーネル内にて関数呼び出しを行うことで、コンパイラの最適化が働かないことが確認された。

論文

GPU-acceleration of locally mesh allocated two phase flow solver for nuclear reactors

小野寺 直幸; 井戸村 泰宏; Ali, Y.*; 山下 晋; 下川辺 隆史*; 青木 尊之*

Proceedings of Joint International Conference on Supercomputing in Nuclear Applications + Monte Carlo 2020 (SNA + MC 2020), p.210 - 215, 2020/10

本研究では、ブロック型局所細分化(AMR)法に基づくPoisson解法のGPU高速化を実施した。ブロック型AMR法はGPUに適したデータ構造であり、複雑な構造物で構成された原子炉等の解析に必須な解析手法である。これに、最新の前処理手法であるマルチグリッド(MG)法を共役勾配(CG)法へと組み合わせることで、計算の高速化を実現した。MG-CG法を構成する計算カーネルをGPUスーパーコンピュータであるTSUBAME3.0上にて測定した結果、ベクトル-ベクトル和、行列-ベクトル積、およびドット積の帯域幅は、ピークパフォーマンスの約60%となり、良好なパフォーマンスを実現した。更に、MG法の前処理手法として、3段のVサイクル法および各段に対してRed-Black SOR法を適用した手法を用いて、$$453.0times10^6$$格子点の大規模問題の解析を実施した結果、元の前処理付きCG法と比較して、反復回数を30%未満に削減すると共に、2.5倍の計算の高速化を達成した。

論文

ブロック型適合細分化格子でのPoisson解法のGPU高速化

小野寺 直幸; 井戸村 泰宏; Ali, Y.*; 下川辺 隆史*; 青木 尊之*

計算工学講演会論文集(CD-ROM), 25, 4 Pages, 2020/06

原子力機構では3次元多相流体解析手法としてJUPITERを開発している。本研究では、JUPITERの圧力Poisson方程式解法として、適合細分化格子(AMR)を用いたマルチグリッド前提条件付き共役勾配法(P-CG)を開発した。計算の高速化として、全ての計算カーネルはCUDAを用いて実装すると共に、GPUスーパーコンピュータ上にて高い性能を発揮する様に最適化した。開発したマルチグリッド圧力Poisson解法は、オリジナルのP-CG法と比較して約1/7の反復回数で収束することが確認された。また、TSUBAME3.0上で8から216GPUまでの強スケーリング性能測定により、更なる3倍の高速化が達成された。

論文

Communication Reduced Multi-time-step Algorithm for Real-time Wind Simulation on GPU-based Supercomputers

小野寺 直幸; 井戸村 泰宏; Ali, Y.*; 下川辺 隆史*

Proceedings of 9th Workshop on Latest Advances in Scalable Algorithms for Large-Scale Systems (ScalA 2018) (Internet), p.9 - 16, 2018/11

 被引用回数:9 パーセンタイル:94.7(Computer Science, Theory & Methods)

計算の高速化に向けて適合細分化格子(AMR)法を適用した格子ボルツマン法(LBM)に対して、通信削減マルチタイムステップ法(CRMT)を提案した。本手法はテンポラルブロッキング法に基づく定式化を行うことで、GPU計算で大きなボトルネックとなる通信回数の削減が可能となる。東京工業大学のTSUBAMEおよび東京大学のReedbushスーパーコンピュータにて性能測定を実施した結果、通信コストが64%に削減され、200GPUまでの弱および強スケーリング結果が改善された。以上の高速化により、2km四方の計算領域に対して1m解像度の風速5msの実時間解析が可能であることが示された。

論文

A Stencil framework to realize large-scale computations beyond device memory capacity on GPU supercomputers

下川辺 隆史*; 遠藤 敏夫*; 小野寺 直幸; 青木 尊之*

Proceedings of 2017 IEEE International Conference on Cluster Computing (IEEE Cluster 2017) (Internet), p.525 - 529, 2017/09

ステンシルに基づくCFDコードは、規則的なメモリアクセスを持つため、GPUで高い性能を得ることができる。しかしながら、GPUはCPUと比較して、メモリ容量が小さいため、CPUと同様の大きさの問題を解くことができない。そこで、本研究では、CPUのホストメモリとCPUのデバイスメモリの局所性を向上させることが可能な、テンポラルブロッキング法を用いることで、GPUのメモリ容量を超える大きさの計算を可能とした。本研究で開発したフレームワークでは、複雑なコーディングは必要とせずに、テンポラルブロッキング法を含む並列計算用のコードを生成できる。フレームワークを用いて開発した気流解析コードでは、TSUBAME2.5において、GPUのメモリ容量の2倍の計算規模においても、通常のメモリ容量の計算の80%程度の実効性能を達成した。

口頭

GPUスパコンTSUBAME2.0におけるメソスケール気象モデルとLES乱流計算

小野寺 直幸; 青木 尊之*; 下川辺 隆史*

no journal, , 

東京工業大学のスーパーコンピュータTSUBAME2.0は、グラフィックス・プロセッシングユニット(GPU)を多数導入することで2.4PFLOPSのピーク性能を有する世界有数のスーパーコンピュータである。本研究ではMPIによる並列計算ライブラリと開発言語CUDAによるGPU計算への適用を行うことで、単相乱流のラージエディ・シミュレーション(LES)コードの高速化を行った。その結果、TSUBAME2.0の64GPUを用いた計算で、1.29TFLOPの倍精度演算性能を達成した。この値はCPUに換算するとIntel Core i7 1コアが1GFlops程度の実効性能となることから、1000コア以上に相当する値である。さらに、GPUを用いた複雑物体周りのLESを行い、複雑物体周りの乱流のストリーク構造を高速に再現できることを確認した。

口頭

An AMR framework for realizing effective high-resolution simulations on multiple GPUs

下川辺 隆史*; 青木 尊之*; 小野寺 直幸

no journal, , 

近年、複数GPU計算において、物理現象に格子解像度を適合させる計算手法が求められている。適合細分化格子(AMR)法は、それらを実現できる有効な手法である。しかしながら、GPU計算において、AMR法の実装および最適化は複雑である。本研究では、CUDAおよびC++言語を用いることで、GPU計算においてAMR法を効率的に開発可能な環境を構築した。本ライブラリを用いることで、プログラマは直交格子上のシンプルな関数を記述するだけで、GPUを利用するAMR法を開発することが可能となる。

口頭

複数GPUを用いた高精細計算を実現するAMR法フレームワークの構築

下川辺 隆史*; 小野寺 直幸

no journal, , 

近年、GPUを用いた並列計算において、適合細分化格子(AMR)法を用いた解析手法が注目を集めている。しかしながら、GPUを用いた並列計算でのAMR法の実装は煩雑であり、高い計算性能を達成するには非常に多くの開発コストが必要である。本研究では、CPU/GPU環境においても高生産なコード開発を実現可能な、AMR法に基づくフレームワークを開発している。フレームワークは単純なステンシルに基づく計算コードを書くだけで、並列のGPUコードの生成が可能となる。本発表では、AMR法のフレームワークに基づく圧縮性流体解析の結果を示す。

口頭

適合細分化格子ボルツマン法による熱流動解析

小野寺 直幸; 井戸村 泰宏; Ali, Y.*; 下川辺 隆史*

no journal, , 

福島第一原子力発電所の廃炉においては熱流動解析が重要なテーマの一つである。日本原子力研究開発機構(JAEA)では、非圧縮性Navier-Stokes方程式の解法であるJUPITERコードを用いて、デブリの空冷解析評価を行なっている。しかしながら、実機を対象とした解析の実施のためには、非常に多くの計算コストが必要となる。本研究では、GPUを用いた大規模計算に適した格子ボルツマン法に基づく熱流動解析手法であるCityLBMコードを構築している。本発表では、CityLBMコードによる自然対流実験との比較を示す。

口頭

Communication reduced multi-time-step algorithm for the AMR-based lattice Boltzmann method on GPU-rich supercomputers

小野寺 直幸; 井戸村 泰宏; Ali, Y.*; 下川辺 隆史*

no journal, , 

本発表ではポスト京用に開発した通信削減マルチタイムステップ法をGPUスーパーコンピュータに適用し、性能測定を行った。この手法はテンポラルブロッキング法に基づいた手法であり、ボトルネックとなる通信部分を他の計算に置き換えることで、通信削減が可能となる。本アルゴリズムを適用した風況解析コードCityLBMを用いて、TSUBAMEおよびReedbushにて性能測定を行なった結果、弱スケーリングで64%に通信量が削減された。本アルゴリズムの適用で、都市部の2km四方の領域に対して、5m/s程度の風速の実時間風況予測が可能であることが確認されると共に、今後のエクサスケールのスーパーコンピュータに対して非常に有効であることが示された。

口頭

局所細分化格子ボルツマン法を用いたオクラホマシティにおけるトレーサー拡散解析

小野寺 直幸; 井戸村 泰宏; 河村 拓馬; 中山 浩成; 下川辺 隆史*

no journal, , 

汚染物質の拡散解析はスマートシティの設計や核セキュリティの向上に重要である。都市部は複雑なビルで構成されているため、流れが乱流となり、大規模なCFD解析が必須である。我々の研究グループでは局所細分化手法を適用した格子ボルツマン法に基づくCFD解析手法を開発している。計算コードは、Pascal世代およびVolta世代の最新のGPUに対して最適化されており、高速な解析が可能である。本研究では、解析手法を用いてオクラホマシティの野外拡散実験に対する解析を行った。計算条件として、気象解析コードであるWRFに基づく風況および実際の都市部のビルデータを用いた。この解析の実施により、実験時の都市部の風況状況および汚染物質の拡散状況を良く再現していることを確認した。

口頭

観測データを適用した局所細分化格子ボルツマン法によるトレーサー拡散解析

小野寺 直幸; 井戸村 泰宏; 河村 拓馬; 中山 浩成; 下川辺 隆史*; 青木 尊之*

no journal, , 

放射性物質の拡散予測シミュレーションは社会的関心が非常に高く、迅速性および正確性が求められている。人が生活する路地や建物等を含んだ高解像度の実時間解析を実施するためには、計算機性能を最大限に引き出すことが可能な解析手法の開発が必須となる。本課題では、GPUスパコンに適した格子ボルツマン法(LBM)に対して、ナッジング法に基づくデータ同化手法および植生キャノピーモデルを導入することで、都市街区に対する汚染物質の拡散解析の精度が向上することを確認した。

36 件中 1件目~20件目を表示