検索対象:     
報告書番号:
※ 半角英数字
 年 ~ 
 年
検索結果: 22 件中 1件目~20件目を表示

発表形式

Initialising ...

選択項目を絞り込む

掲載資料名

Initialising ...

発表会議名

Initialising ...

筆頭著者名

Initialising ...

キーワード

Initialising ...

使用言語

Initialising ...

発行年

Initialising ...

開催年

Initialising ...

選択した検索結果をダウンロード

論文

Real-time tracer dispersion simulations in Oklahoma City using the locally mesh-refined lattice Boltzmann method

小野寺 直幸; 井戸村 泰宏; 長谷川 雄太; 中山 浩成; 下川辺 隆史*; 青木 尊之*

Boundary-Layer Meteorology, 179(2), p.187 - 208, 2021/05

 被引用回数:2 パーセンタイル:91.88(Meteorology & Atmospheric Sciences)

汚染物質の拡散解析手法CityLBMは、GPUスーパーコンピュータ上において、適合細分化格子(AMR)法を適用する事で、数kmの解析領域の実時間解析が可能である。本論文では、CityLBMの検証としてオクラホマ市で実施された野外拡散実験(JU2003)に対する解析を実施した。計算条件として、Weather Research and Forecasting(WRF)モデルを用いた風況条件および、建物と植生を考慮した地表面データをCityLBMに与えることで、JU2003の実験条件を再現した。さらにアンサンブル計算の実施により、乱流の不確実性を軽減した。汚染物質の時間平均濃度および最大値を実験測定値と比較した結果、アンサンブル計算により解析精度を向上すると共に、2m解像度・4km四方の解析では、24個の計測値に対して70%の高い割合でFactor2を満たす事を確認した。

論文

ブロック型適合細分化格子でのPoisson解法の混合精度演算による高速化

小野寺 直幸; 井戸村 泰宏; 長谷川 雄太; 下川辺 隆史*; 青木 尊之*

計算工学講演会論文集(CD-ROM), 26, 3 Pages, 2021/05

本研究では、二相流体解析コードJUPITER-AMRに対して、圧力ポアソン方程式に対する混合精度前処理手法を開発した。マルチグリッド前処理手法として、3段のVサイクルの幾何学的MG法およびキャッシュを再利用したSOR(CR-SOR)法を適用した。原子力工学問題での性能測定として、バンドル体系に対する多相流体解析を実施した。計算速度として、単精度演算を適用する事で、倍精度演算の75%へと削減すると共に、強スケーリング性能においては、32台から96台のGPUを利用する事で1.88倍を実現した。

論文

機械学習による細分化格子に基づく二次元定常流予測

朝比 祐一; 畑山 そら*; 下川辺 隆史*; 小野寺 直幸; 長谷川 雄太; 井戸村 泰宏

計算工学講演会論文集(CD-ROM), 26, 4 Pages, 2021/05

多重解像度の定常流流れ場を符合付き距離関数から予測するConvolutional Neural networkモデルを開発した。高解像度の画像生成を可能とするネットワークPix2PixHDをパッチ化された高解像度データに適用することで、通常のPix2PixHDよりメモリ使用量を削減しつつ、高解像度流れ場の予測が可能であることを示した。

論文

GPU acceleration of multigrid preconditioned conjugate gradient solver on block-structured Cartesian grid

小野寺 直幸; 井戸村 泰宏; 長谷川 雄太; 山下 晋; 下川辺 隆史*; 青木 尊之*

Proceedings of International Conference on High Performance Computing in Asia-Pacific Region (HPC Asia 2021) (Internet), p.120 - 128, 2021/01

 被引用回数:0

本研究では、二相流体解析コードJUPITERに対して、マルチグリッド前処理付き共役勾配(MG-CG)法を開発した。MG法は、3段のVサイクルMG法に基づいて構築し、各段に対して、RB-SOR法およびGPUのキャッシュを再利用したCR-SORを開発・適用した。性能測定として、バンドル体系に対する気液二相流体解析を行った。RB-SOR法およびCR-SOR法を適用したMG-CG法では、MG法を適用しないPCG法と比較して、収束までの反復回数を15%と9%以下に削減するとともに、3.1倍, 5.9倍の計算速度が達成された。以上の結果から、本研究で開発したMG-CG法は、GPUを用いたスーパーコンピュータ上にて、効率的に大規模な二相流体解析が可能であることが示された。

論文

ブロック型適合細分化格子でのPoisson解法のGPU・CPU・ARMプロセッサに対する性能測定

小野寺 直幸; 井戸村 泰宏; 朝比 祐一; 長谷川 雄太; 下川辺 隆史*; 青木 尊之*

第34回数値流体力学シンポジウム講演論文集(インターネット), 2 Pages, 2020/12

本研究では、二相流体解析コードJUPITERにおいて、圧力ポアソン方程式に対するマルチグリッド前提共役勾配(MG-CG)ソルバーを開発した。プログラムの開発言語として、C++およびCUDAを用いることで、様々なコンピュータプラットフォームに対応した。CG解法の主な計算カーネルは、GPU, CPU、およびARM上において、ルーフライン性能の0.4$$sim$$0.75と妥当な性能を達成した。一方で、SpMVカーネルでは、ARM上において、大幅な性能劣化が確認された。その原因を調査したところ、SpMVカーネル内にて関数呼び出しを行うことで、コンパイラの最適化が働かないことが確認された。

論文

GPU-acceleration of locally mesh allocated two phase flow solver for nuclear reactors

小野寺 直幸; 井戸村 泰宏; Ali, Y.*; 山下 晋; 下川辺 隆史*; 青木 尊之*

Proceedings of Joint International Conference on Supercomputing in Nuclear Applications + Monte Carlo 2020 (SNA + MC 2020), p.210 - 215, 2020/10

本研究では、ブロック型局所細分化(AMR)法に基づくPoisson解法のGPU高速化を実施した。ブロック型AMR法はGPUに適したデータ構造であり、複雑な構造物で構成された原子炉等の解析に必須な解析手法である。これに、最新の前処理手法であるマルチグリッド(MG)法を共役勾配(CG)法へと組み合わせることで、計算の高速化を実現した。MG-CG法を構成する計算カーネルをGPUスーパーコンピュータであるTSUBAME3.0上にて測定した結果、ベクトル-ベクトル和、行列-ベクトル積、およびドット積の帯域幅は、ピークパフォーマンスの約60%となり、良好なパフォーマンスを実現した。更に、MG法の前処理手法として、3段のVサイクル法および各段に対してRed-Black SOR法を適用した手法を用いて、$$453.0times10^6$$格子点の大規模問題の解析を実施した結果、元の前処理付きCG法と比較して、反復回数を30%未満に削減すると共に、2.5倍の計算の高速化を達成した。

論文

ブロック型適合細分化格子でのPoisson解法のGPU高速化

小野寺 直幸; 井戸村 泰宏; Ali, Y.*; 下川辺 隆史*; 青木 尊之*

計算工学講演会論文集(CD-ROM), 25, 4 Pages, 2020/06

原子力機構では3次元多相流体解析手法としてJUPITERを開発している。本研究では、JUPITERの圧力Poisson方程式解法として、適合細分化格子(AMR)を用いたマルチグリッド前提条件付き共役勾配法(P-CG)を開発した。計算の高速化として、全ての計算カーネルはCUDAを用いて実装すると共に、GPUスーパーコンピュータ上にて高い性能を発揮する様に最適化した。開発したマルチグリッド圧力Poisson解法は、オリジナルのP-CG法と比較して約1/7の反復回数で収束することが確認された。また、TSUBAME3.0上で8から216GPUまでの強スケーリング性能測定により、更なる3倍の高速化が達成された。

論文

Communication Reduced Multi-time-step Algorithm for Real-time Wind Simulation on GPU-based Supercomputers

小野寺 直幸; 井戸村 泰宏; Ali, Y.*; 下川辺 隆史*

Proceedings of 9th Workshop on Latest Advances in Scalable Algorithms for Large-Scale Systems (ScalA 2018) (Internet), p.9 - 16, 2018/11

 被引用回数:5 パーセンタイル:95.04

計算の高速化に向けて適合細分化格子(AMR)法を適用した格子ボルツマン法(LBM)に対して、通信削減マルチタイムステップ法(CRMT)を提案した。本手法はテンポラルブロッキング法に基づく定式化を行うことで、GPU計算で大きなボトルネックとなる通信回数の削減が可能となる。東京工業大学のTSUBAMEおよび東京大学のReedbushスーパーコンピュータにて性能測定を実施した結果、通信コストが64%に削減され、200GPUまでの弱および強スケーリング結果が改善された。以上の高速化により、2km四方の計算領域に対して1m解像度の風速5msの実時間解析が可能であることが示された。

論文

A Stencil framework to realize large-scale computations beyond device memory capacity on GPU supercomputers

下川辺 隆史*; 遠藤 敏夫*; 小野寺 直幸; 青木 尊之*

Proceedings of 2017 IEEE International Conference on Cluster Computing (IEEE Cluster 2017) (Internet), p.525 - 529, 2017/09

ステンシルに基づくCFDコードは、規則的なメモリアクセスを持つため、GPUで高い性能を得ることができる。しかしながら、GPUはCPUと比較して、メモリ容量が小さいため、CPUと同様の大きさの問題を解くことができない。そこで、本研究では、CPUのホストメモリとCPUのデバイスメモリの局所性を向上させることが可能な、テンポラルブロッキング法を用いることで、GPUのメモリ容量を超える大きさの計算を可能とした。本研究で開発したフレームワークでは、複雑なコーディングは必要とせずに、テンポラルブロッキング法を含む並列計算用のコードを生成できる。フレームワークを用いて開発した気流解析コードでは、TSUBAME2.5において、GPUのメモリ容量の2倍の計算規模においても、通常のメモリ容量の計算の80%程度の実効性能を達成した。

口頭

GPUスパコンTSUBAME2.0におけるメソスケール気象モデルとLES乱流計算

小野寺 直幸; 青木 尊之*; 下川辺 隆史*

no journal, , 

東京工業大学のスーパーコンピュータTSUBAME2.0は、グラフィックス・プロセッシングユニット(GPU)を多数導入することで2.4PFLOPSのピーク性能を有する世界有数のスーパーコンピュータである。本研究ではMPIによる並列計算ライブラリと開発言語CUDAによるGPU計算への適用を行うことで、単相乱流のラージエディ・シミュレーション(LES)コードの高速化を行った。その結果、TSUBAME2.0の64GPUを用いた計算で、1.29TFLOPの倍精度演算性能を達成した。この値はCPUに換算するとIntel Core i7 1コアが1GFlops程度の実効性能となることから、1000コア以上に相当する値である。さらに、GPUを用いた複雑物体周りのLESを行い、複雑物体周りの乱流のストリーク構造を高速に再現できることを確認した。

口頭

An AMR framework for realizing effective high-resolution simulations on multiple GPUs

下川辺 隆史*; 青木 尊之*; 小野寺 直幸

no journal, , 

近年、複数GPU計算において、物理現象に格子解像度を適合させる計算手法が求められている。適合細分化格子(AMR)法は、それらを実現できる有効な手法である。しかしながら、GPU計算において、AMR法の実装および最適化は複雑である。本研究では、CUDAおよびC++言語を用いることで、GPU計算においてAMR法を効率的に開発可能な環境を構築した。本ライブラリを用いることで、プログラマは直交格子上のシンプルな関数を記述するだけで、GPUを利用するAMR法を開発することが可能となる。

口頭

複数GPUを用いた高精細計算を実現するAMR法フレームワークの構築

下川辺 隆史*; 小野寺 直幸

no journal, , 

近年、GPUを用いた並列計算において、適合細分化格子(AMR)法を用いた解析手法が注目を集めている。しかしながら、GPUを用いた並列計算でのAMR法の実装は煩雑であり、高い計算性能を達成するには非常に多くの開発コストが必要である。本研究では、CPU/GPU環境においても高生産なコード開発を実現可能な、AMR法に基づくフレームワークを開発している。フレームワークは単純なステンシルに基づく計算コードを書くだけで、並列のGPUコードの生成が可能となる。本発表では、AMR法のフレームワークに基づく圧縮性流体解析の結果を示す。

口頭

適合細分化格子ボルツマン法による熱流動解析

小野寺 直幸; 井戸村 泰宏; Ali, Y.*; 下川辺 隆史*

no journal, , 

福島第一原子力発電所の廃炉においては熱流動解析が重要なテーマの一つである。日本原子力研究開発機構(JAEA)では、非圧縮性Navier-Stokes方程式の解法であるJUPITERコードを用いて、デブリの空冷解析評価を行なっている。しかしながら、実機を対象とした解析の実施のためには、非常に多くの計算コストが必要となる。本研究では、GPUを用いた大規模計算に適した格子ボルツマン法に基づく熱流動解析手法であるCityLBMコードを構築している。本発表では、CityLBMコードによる自然対流実験との比較を示す。

口頭

Communication reduced multi-time-step algorithm for the AMR-based lattice Boltzmann method on GPU-rich supercomputers

小野寺 直幸; 井戸村 泰宏; Ali, Y.*; 下川辺 隆史*

no journal, , 

本発表ではポスト京用に開発した通信削減マルチタイムステップ法をGPUスーパーコンピュータに適用し、性能測定を行った。この手法はテンポラルブロッキング法に基づいた手法であり、ボトルネックとなる通信部分を他の計算に置き換えることで、通信削減が可能となる。本アルゴリズムを適用した風況解析コードCityLBMを用いて、TSUBAMEおよびReedbushにて性能測定を行なった結果、弱スケーリングで64%に通信量が削減された。本アルゴリズムの適用で、都市部の2km四方の領域に対して、5m/s程度の風速の実時間風況予測が可能であることが確認されると共に、今後のエクサスケールのスーパーコンピュータに対して非常に有効であることが示された。

口頭

局所細分化格子ボルツマン法を用いたオクラホマシティにおけるトレーサー拡散解析

小野寺 直幸; 井戸村 泰宏; 河村 拓馬; 中山 浩成; 下川辺 隆史*

no journal, , 

汚染物質の拡散解析はスマートシティの設計や核セキュリティの向上に重要である。都市部は複雑なビルで構成されているため、流れが乱流となり、大規模なCFD解析が必須である。我々の研究グループでは局所細分化手法を適用した格子ボルツマン法に基づくCFD解析手法を開発している。計算コードは、Pascal世代およびVolta世代の最新のGPUに対して最適化されており、高速な解析が可能である。本研究では、解析手法を用いてオクラホマシティの野外拡散実験に対する解析を行った。計算条件として、気象解析コードであるWRFに基づく風況および実際の都市部のビルデータを用いた。この解析の実施により、実験時の都市部の風況状況および汚染物質の拡散状況を良く再現していることを確認した。

口頭

観測データを適用した局所細分化格子ボルツマン法によるトレーサー拡散解析

小野寺 直幸; 井戸村 泰宏; 河村 拓馬; 中山 浩成; 下川辺 隆史*; 青木 尊之*

no journal, , 

放射性物質の拡散予測シミュレーションは社会的関心が非常に高く、迅速性および正確性が求められている。人が生活する路地や建物等を含んだ高解像度の実時間解析を実施するためには、計算機性能を最大限に引き出すことが可能な解析手法の開発が必須となる。本課題では、GPUスパコンに適した格子ボルツマン法(LBM)に対して、ナッジング法に基づくデータ同化手法および植生キャノピーモデルを導入することで、都市街区に対する汚染物質の拡散解析の精度が向上することを確認した。

口頭

畳み込みニューラルネットワークと境界交換を用いた複数領域にまたがる定常流のシミュレーション結果の予測

畑山 そら*; 下川辺 隆史*; 小野寺 直幸

no journal, , 

数値流体力学(CFD)は、流体現象を解析する手法として広く用いられている。しかしながら、これらを工学問題に適用した場合、計算コストが大きい事と、流体現象が定常状態に到達するまでに長時間の計算が必要という問題があげられる。この問題の解決策として、我々の研究グループでは、深層学習法の1つである畳み込みニューラルネットワーク(CNN)の使用を試みた。本研究では、CNNによる定常流体解析の高速な予測と、複数の計算領域間の袖領域の情報交換を組み合わせることで、高速な大領域の解析を実現した。

口頭

Multigrid Poisson solver for a block-structured adaptive mesh refinement method on CPU and GPU supercomputers

小野寺 直幸; 井戸村 泰宏; 朝比 祐一; 長谷川 雄太; 下川辺 隆史*; 青木 尊之*

no journal, , 

本研究では、CPUおよびGPUスーパーコンピュータで動作するブロック型適合細分化格子に基づくポアソン解法を開発した。ブロック型適合細分化格子法は、複雑な構造物で構成される原子炉等のCFD解析に対して、有効である。前処理手法として、3段VサイクルMG法を実装するとともに、混合精度を用いて計算を高速化した。TSUBAMEのGPUを用いた計算にて、$$4.53 times 10^8$$格子の大規模問題に対して、提案した手法はオリジナルの前提条件付きCG法と比較して、反復回数を30%以下に削減し、2倍の高速化を達成した。この研究成果は、CPUやGPU等のそれぞれの計算機での堅牢性,計算精度,スレッド並列化,キャッシュサイズなどを議論する上で有用である。

口頭

High-resolution simulations using an AMR framework on GPU supercomputers

下川辺 隆史*; 小野寺 直幸

no journal, , 

適合細分化格子(AMR)法は、局所的に格子の解像度を上げることができる有効な手法の一つである。本研究では、AMR法を適用したコードに対して、計算性能を維持しつつ効率的に記述するためのステンシルアプリケーション用のフレームワークを開発した。このフレームワークでは、プログラマは格子点を更新するC++11のラムダを記述するだけで、ツリーベースのAMRデータ上の物理量の更新が可能となる。圧縮性流体計算の性能測定を実施した結果、東京工業大学のGPUスーパーコンピュータTSUBAME3.0上にて、並列効率が84%の良いスケーラビリティが示された。

口頭

Steady flow prediction across multiple regions using deep learning and boundary exchange

畑山 そら*; 下川辺 隆史*; 小野寺 直幸

no journal, , 

本研究は、入力形状を複数の部分に分割し、各部分に小型ニューラルネットワークを並列に適用することで、大規模シミュレーションの結果が予測可能な手法を提案した。構築したモデルは、符号付き距離関数を入力として用いることで2次元の速度場を予測が可能となる。この方法に加えて、大きな領域を複数の領域に分割し、分割された領域に対して予測を反復的に実施する。最終的には、境界交換法を用いることで複数の領域にまたがる速度場が再現されることを確認した。

22 件中 1件目~20件目を表示