検索対象:     
報告書番号:
※ 半角英数字
 年 ~ 
 年
検索結果: 6 件中 1件目~6件目を表示
  • 1

発表形式

Initialising ...

選択項目を絞り込む

掲載資料名

Initialising ...

発表会議名

Initialising ...

筆頭著者名

Initialising ...

キーワード

Initialising ...

使用言語

Initialising ...

発行年

Initialising ...

開催年

Initialising ...

選択した検索結果をダウンロード

論文

Communication Reduced Multi-time-step Algorithm for Real-time Wind Simulation on GPU-based Supercomputers

小野寺 直幸; 井戸村 泰宏; Yussuf, A.*; 下川辺 隆史*

Proceedings of 9th Workshop on Latest Advances in Scalable Algorithms for Large-Scale Systems (ScalA 2018) (Internet), p.9 - 16, 2018/11

計算の高速化に向けて適合細分化格子(AMR)法を適用した格子ボルツマン法(LBM)に対して、通信削減マルチタイムステップ法(CRMT)を提案した。本手法はテンポラルブロッキング法に基づく定式化を行うことで、GPU計算で大きなボトルネックとなる通信回数の削減が可能となる。東京工業大学のTSUBAMEおよび東京大学のReedbushスーパーコンピュータにて性能測定を実施した結果、通信コストが64%に削減され、200GPUまでの弱および強スケーリング結果が改善された。以上の高速化により、2km四方の計算領域に対して1m解像度の風速5msの実時間解析が可能であることが示された。

口頭

局所細分化格子を用いた格子ボルツマン法へのテンポラルブロッキング法の適用

小野寺 直幸; 井戸村 泰宏; Yussuf, A.*

no journal, , 

放射性物質のリアルタイムシミュレーションは核セキュリティの観点から非常に重要である。都市は多くの建物や路地を含むため、その詳細な気流を解析するためには大規模なCFDの実施が必要となる。ブロックベースのAMR法に基づく格子ボルツマン法を用いることで、マルチスケールの気流解析が実現できる。計算コードはリアルタイムシミュレーションを実施するために、GPUを用いて開発を行なっている。本研究では並列計算性能の向上のために、テンポラルブロッキング法を用いた省通信型マルチタイムステップアルゴリズムを提案した。日本原子力研究開発機構のGPUクラスタ(NVIDIA P100)に対して性能測定を行なった結果、488MLUPSの非常に高い計算性能の達成および、通信量の削減が確認された。

口頭

Development of exascale matrix solvers based on communication avoiding algorithms

今村 俊幸*; 井戸村 泰宏; 伊奈 拓也*; 山下 晋; 小野寺 直幸; Yussuf, A.*; 山田 進

no journal, , 

ポスト京におけるエクサスケール計算に向けて、省通信アルゴリズムに基づく新たな行列ソルバが開発されている。本講演では、3次元多相熱流動解析CFDコードJUPITERで用いられている2つの手法を紹介する。一つは省通信クリロフ部分空間法である。この手法では複数の基底ベクトルの生成、直交化を一度に処理することで大域的集団通信の回数を削減する。もう一つ手法であるマルチグリッド前処理付クリロフ部分空間法は収束特性を飛躍的に向上し、反復、すなわち、大域的集団通信の回数を削減する。最新のメニーコア環境におけるこれらの手法の比較を議論する。

口頭

Porting a state-of-the-art communication avoiding Krylov subspace solver on P100 GPUs

Yussuf, A.*; 伊奈 拓也*; 小野寺 直幸; 井戸村 泰宏

no journal, , 

圧力ポアソン方程式のクリロフ部分空間法ソルバは大規模多相CFDシミュレーションにおいて全計算コストの$$sim 90%$$を占める。このポアソンソルバを加速するためにブロックヤコビ(BJ)前処理付きチェビシェフ基底共役勾配法(CBCG)ソルバをP100GPUに移植した。CBCGソルバはBJ前処理, 疎行列ベクトル積(SpMV), 非正方行列積から構成される。本研究ではスレッド・ブロック並列処理と効率的なコアレスドロードのためにBJ前処理を再設計し、非正方行列積にBatched GEMMを適用した。上記最適化により全ての主要カーネルでルーフラインに基づく理論性能の$$sim 90%$$を達成し、CPUノードに比べて一桁以上のノード性能向上が得られた。

口頭

適合細分化格子ボルツマン法による熱流動解析

小野寺 直幸; 井戸村 泰宏; Yussuf, A.*; 下川辺 隆史*

no journal, , 

福島第一原子力発電所の廃炉においては熱流動解析が重要なテーマの一つである。日本原子力研究開発機構(JAEA)では、非圧縮性Navier-Stokes方程式の解法であるJUPITERコードを用いて、デブリの空冷解析評価を行なっている。しかしながら、実機を対象とした解析の実施のためには、非常に多くの計算コストが必要となる。本研究では、GPUを用いた大規模計算に適した格子ボルツマン法に基づく熱流動解析手法であるCityLBMコードを構築している。本発表では、CityLBMコードによる自然対流実験との比較を示す。

口頭

Communication reduced multi-time-step algorithm for the AMR-based lattice Boltzmann method on GPU-rich supercomputers

小野寺 直幸; 井戸村 泰宏; Yussuf, A.*; 下川辺 隆史*

no journal, , 

本発表ではポスト京用に開発した通信削減マルチタイムステップ法をGPUスーパーコンピュータに適用し、性能測定を行った。この手法はテンポラルブロッキング法に基づいた手法であり、ボトルネックとなる通信部分を他の計算に置き換えることで、通信削減が可能となる。本アルゴリズムを適用した風況解析コードCityLBMを用いて、TSUBAMEおよびReedbushにて性能測定を行なった結果、弱スケーリングで64%に通信量が削減された。本アルゴリズムの適用で、都市部の2km四方の領域に対して、5m/s程度の風速の実時間風況予測が可能であることが確認されると共に、今後のエクサスケールのスーパーコンピュータに対して非常に有効であることが示された。

6 件中 1件目~6件目を表示
  • 1