検索対象:     
報告書番号:
※ 半角英数字
 年 ~ 
 年
検索結果: 8 件中 1件目~8件目を表示
  • 1

発表形式

Initialising ...

選択項目を絞り込む

掲載資料名

Initialising ...

発表会議名

Initialising ...

筆頭著者名

Initialising ...

キーワード

Initialising ...

使用言語

Initialising ...

発行年

Initialising ...

開催年

Initialising ...

選択した検索結果をダウンロード

論文

Communication Reduced Multi-time-step Algorithm for Real-time Wind Simulation on GPU-based Supercomputers

小野寺 直幸; 井戸村 泰宏; Yussuf, A.*; 下川辺 隆史*

Proceedings of 9th Workshop on Latest Advances in Scalable Algorithms for Large-Scale Systems (ScalA 2018) (Internet), p.9 - 16, 2018/11

計算の高速化に向けて適合細分化格子(AMR)法を適用した格子ボルツマン法(LBM)に対して、通信削減マルチタイムステップ法(CRMT)を提案した。本手法はテンポラルブロッキング法に基づく定式化を行うことで、GPU計算で大きなボトルネックとなる通信回数の削減が可能となる。東京工業大学のTSUBAMEおよび東京大学のReedbushスーパーコンピュータにて性能測定を実施した結果、通信コストが64%に削減され、200GPUまでの弱および強スケーリング結果が改善された。以上の高速化により、2km四方の計算領域に対して1m解像度の風速5msの実時間解析が可能であることが示された。

論文

A Stencil framework to realize large-scale computations beyond device memory capacity on GPU supercomputers

下川辺 隆史*; 遠藤 敏夫*; 小野寺 直幸; 青木 尊之*

Proceedings of 2017 IEEE International Conference on Cluster Computing (IEEE Cluster 2017) (Internet), p.525 - 529, 2017/09

ステンシルに基づくCFDコードは、規則的なメモリアクセスを持つため、GPUで高い性能を得ることができる。しかしながら、GPUはCPUと比較して、メモリ容量が小さいため、CPUと同様の大きさの問題を解くことができない。そこで、本研究では、CPUのホストメモリとCPUのデバイスメモリの局所性を向上させることが可能な、テンポラルブロッキング法を用いることで、GPUのメモリ容量を超える大きさの計算を可能とした。本研究で開発したフレームワークでは、複雑なコーディングは必要とせずに、テンポラルブロッキング法を含む並列計算用のコードを生成できる。フレームワークを用いて開発した気流解析コードでは、TSUBAME2.5において、GPUのメモリ容量の2倍の計算規模においても、通常のメモリ容量の計算の80%程度の実効性能を達成した。

口頭

GPUスパコンTSUBAME2.0におけるメソスケール気象モデルとLES乱流計算

小野寺 直幸; 青木 尊之*; 下川辺 隆史*

no journal, , 

東京工業大学のスーパーコンピュータTSUBAME2.0は、グラフィックス・プロセッシングユニット(GPU)を多数導入することで2.4PFLOPSのピーク性能を有する世界有数のスーパーコンピュータである。本研究ではMPIによる並列計算ライブラリと開発言語CUDAによるGPU計算への適用を行うことで、単相乱流のラージエディ・シミュレーション(LES)コードの高速化を行った。その結果、TSUBAME2.0の64GPUを用いた計算で、1.29TFLOPの倍精度演算性能を達成した。この値はCPUに換算するとIntel Core i7 1コアが1GFlops程度の実効性能となることから、1000コア以上に相当する値である。さらに、GPUを用いた複雑物体周りのLESを行い、複雑物体周りの乱流のストリーク構造を高速に再現できることを確認した。

口頭

An AMR framework for realizing effective high-resolution simulations on multiple GPUs

下川辺 隆史*; 青木 尊之; 小野寺 直幸

no journal, , 

近年、複数GPU計算において、物理現象に格子解像度を適合させる計算手法が求められている。適合細分化格子(AMR)法は、それらを実現できる有効な手法である。しかしながら、GPU計算において、AMR法の実装および最適化は複雑である。本研究では、CUDAおよびC++言語を用いることで、GPU計算においてAMR法を効率的に開発可能な環境を構築した。本ライブラリを用いることで、プログラマは直交格子上のシンプルな関数を記述するだけで、GPUを利用するAMR法を開発することが可能となる。

口頭

複数GPUを用いた高精細計算を実現するAMR法フレームワークの構築

下川辺 隆史*; 小野寺 直幸

no journal, , 

近年、GPUを用いた並列計算において、適合細分化格子(AMR)法を用いた解析手法が注目を集めている。しかしながら、GPUを用いた並列計算でのAMR法の実装は煩雑であり、高い計算性能を達成するには非常に多くの開発コストが必要である。本研究では、CPU/GPU環境においても高生産なコード開発を実現可能な、AMR法に基づくフレームワークを開発している。フレームワークは単純なステンシルに基づく計算コードを書くだけで、並列のGPUコードの生成が可能となる。本発表では、AMR法のフレームワークに基づく圧縮性流体解析の結果を示す。

口頭

適合細分化格子ボルツマン法による熱流動解析

小野寺 直幸; 井戸村 泰宏; Yussuf, A.*; 下川辺 隆史*

no journal, , 

福島第一原子力発電所の廃炉においては熱流動解析が重要なテーマの一つである。日本原子力研究開発機構(JAEA)では、非圧縮性Navier-Stokes方程式の解法であるJUPITERコードを用いて、デブリの空冷解析評価を行なっている。しかしながら、実機を対象とした解析の実施のためには、非常に多くの計算コストが必要となる。本研究では、GPUを用いた大規模計算に適した格子ボルツマン法に基づく熱流動解析手法であるCityLBMコードを構築している。本発表では、CityLBMコードによる自然対流実験との比較を示す。

口頭

Communication reduced multi-time-step algorithm for the AMR-based lattice Boltzmann method on GPU-rich supercomputers

小野寺 直幸; 井戸村 泰宏; Yussuf, A.*; 下川辺 隆史*

no journal, , 

本発表ではポスト京用に開発した通信削減マルチタイムステップ法をGPUスーパーコンピュータに適用し、性能測定を行った。この手法はテンポラルブロッキング法に基づいた手法であり、ボトルネックとなる通信部分を他の計算に置き換えることで、通信削減が可能となる。本アルゴリズムを適用した風況解析コードCityLBMを用いて、TSUBAMEおよびReedbushにて性能測定を行なった結果、弱スケーリングで64%に通信量が削減された。本アルゴリズムの適用で、都市部の2km四方の領域に対して、5m/s程度の風速の実時間風況予測が可能であることが確認されると共に、今後のエクサスケールのスーパーコンピュータに対して非常に有効であることが示された。

口頭

局所細分化格子ボルツマン法を用いたオクラホマシティにおけるトレーサー拡散解析

小野寺 直幸; 井戸村 泰宏; 河村 拓馬; 中山 浩成; 下川辺 隆史*

no journal, , 

汚染物質の拡散解析はスマートシティの設計や核セキュリティの向上に重要である。都市部は複雑なビルで構成されているため、流れが乱流となり、大規模なCFD解析が必須である。我々の研究グループでは局所細分化手法を適用した格子ボルツマン法に基づくCFD解析手法を開発している。計算コードは、Pascal世代およびVolta世代の最新のGPUに対して最適化されており、高速な解析が可能である。本研究では、解析手法を用いてオクラホマシティの野外拡散実験に対する解析を行った。計算条件として、気象解析コードであるWRFに基づく風況および実際の都市部のビルデータを用いた。この解析の実施により、実験時の都市部の風況状況および汚染物質の拡散状況を良く再現していることを確認した。

8 件中 1件目~8件目を表示
  • 1