検索対象:     
報告書番号:
※ 半角英数字
 年 ~ 
 年
検索結果: 13 件中 1件目~13件目を表示
  • 1

発表形式

Initialising ...

選択項目を絞り込む

掲載資料名

Initialising ...

発表会議名

Initialising ...

筆頭著者名

Initialising ...

キーワード

Initialising ...

使用言語

Initialising ...

発行年

Initialising ...

開催年

Initialising ...

選択した検索結果をダウンロード

論文

Communication Reduced Multi-time-step Algorithm for Real-time Wind Simulation on GPU-based Supercomputers

小野寺 直幸; 井戸村 泰宏; Yussuf, A.*; 下川辺 隆史*

Proceedings of 9th Workshop on Latest Advances in Scalable Algorithms for Large-Scale Systems (ScalA 2018) (Internet), p.9 - 16, 2018/11

計算の高速化に向けて適合細分化格子(AMR)法を適用した格子ボルツマン法(LBM)に対して、通信削減マルチタイムステップ法(CRMT)を提案した。本手法はテンポラルブロッキング法に基づく定式化を行うことで、GPU計算で大きなボトルネックとなる通信回数の削減が可能となる。東京工業大学のTSUBAMEおよび東京大学のReedbushスーパーコンピュータにて性能測定を実施した結果、通信コストが64%に削減され、200GPUまでの弱および強スケーリング結果が改善された。以上の高速化により、2km四方の計算領域に対して1m解像度の風速5msの実時間解析が可能であることが示された。

論文

Acceleration of wind simulation using locally mesh-refined Lattice Boltzmann Method on GPU-Rich supercomputers

小野寺 直幸; 井戸村 泰宏

Lecture Notes in Computer Science 10776, p.128 - 145, 2018/00

本研究では、局所細分化格子を適用した格子ボルツマン法を開発した。計算コードは、東京工業大学のGPUベースのスーパーコンピュータTSUBAME3.0を用いて開発を行い、最新のPascalアーキテクチャに対して最適化を行なった。1から36ノードを用いた弱スケーリングの性能測定では、NVIDIA TESLA P100を用いたGPU計算がBroadwellによるCPU計算の10倍以上の高速化が達成された。

論文

A Stencil framework to realize large-scale computations beyond device memory capacity on GPU supercomputers

下川辺 隆史*; 遠藤 敏夫*; 小野寺 直幸; 青木 尊之*

Proceedings of 2017 IEEE International Conference on Cluster Computing (IEEE Cluster 2017) (Internet), p.525 - 529, 2017/09

ステンシルに基づくCFDコードは、規則的なメモリアクセスを持つため、GPUで高い性能を得ることができる。しかしながら、GPUはCPUと比較して、メモリ容量が小さいため、CPUと同様の大きさの問題を解くことができない。そこで、本研究では、CPUのホストメモリとCPUのデバイスメモリの局所性を向上させることが可能な、テンポラルブロッキング法を用いることで、GPUのメモリ容量を超える大きさの計算を可能とした。本研究で開発したフレームワークでは、複雑なコーディングは必要とせずに、テンポラルブロッキング法を含む並列計算用のコードを生成できる。フレームワークを用いて開発した気流解析コードでは、TSUBAME2.5において、GPUのメモリ容量の2倍の計算規模においても、通常のメモリ容量の計算の80%程度の実効性能を達成した。

論文

A Numerical study of turbulence statistics and the structure of a spatially-developing boundary layer over a realistic urban geometry

稲垣 厚志*; 神田 学*; Ahmad, N. H.*; 八木 綾子*; 小野寺 直幸; 青木 尊之*

Boundary-Layer Meteorology, 164(2), p.161 - 181, 2017/08

 被引用回数:2 パーセンタイル:68.43(Meteorology & Atmospheric Sciences)

本研究では、東京都市部に対して、中立安定状態における大気境界層に対する数値解析を行なった。GPUを用いた並列計算を実施することで、19.2km$$times$$4.8km$$times$$1kmの領域に対して2m解像度のラージエディ・シミュレーションが可能となった。大規模計算結果より、境界層上部の乱流統計量や境界層全域におよび特徴的なストリーク構造等の再現が可能であることが確認された。

口頭

核融合シミュレーションコードのGPUクラスタにおける高性能実装

松本 和也; 朝比 祐一*; 伊奈 拓也; 井戸村 泰宏

no journal, , 

核融合プラズマ流体解析コードGT5Dの主要計算カーネルをGPUクラスタにおいて実装し、性能評価を行った結果を述べる。本研究ではコード内で性能ボトルネックとなっている反復法行列ソルバに対してGPU上でのチューニングを行い、実測性能とルーフラインモデルにより算出した達成可能な実効性能との比較をする。また、複数GPUを使用するためにGPU間直接通信技術を用いた実装についても述べる。

口頭

GPUを用いた格子ボルツマン法による固気液連成解析モデルの開発

小野寺 直幸; 大橋 訓英*

no journal, , 

荒天下での船舶の操縦性性能は安全性に直結するため、重要な研究課題の一つである。船舶の運動を詳細に解析するためには、固気液三相流に対して大規模解析を行う必要がある。本研究では格子ボルツマン法に多相流モデルを適用し解析を行った。格子ボルツマン法は連続的なメモリアクセスを行う計算手法であるため大規模計算に適した手法である。計算コードはGPUの言語であるCUDAに基づき書かれており、東京工業大学のスパコンTSUBAMEにおいて良い実行性能が得られている。また提案した多相流解析モデルは、気相と液相に対してそれぞれ独立に解析を行うことで、非定常な現象に対しても安定に解析が行うことが可能な手法である。本発表では有効性を確認するために、実際のバルクキャリアデータを読み込んだ700$$times$$120$$times$$400格子点の解析を行い、高密度比の条件下において安定な解析が行えることを示した。

口頭

HA-PACS/TCAにおけるCA-GMRES通信回避型Krylov部分空間法の実装と評価

松本 和也*; 井戸村 泰宏; 伊奈 拓也*; 真弓 明恵; 山田 進

no journal, , 

省通信クリロフ法はメニーコアプロセッサやアクセラレータに基づくスーパーコンピュータにおける通信処理のボトルネックに対する有望な解決策となっている。本研究ではGPUクラスタHA-PACSに省通信GMRES法を実装し、原子力流体コードの非対称行列ソルバに関して性能評価を実施した。評価結果から、省通信GMRES法はGMRES法やGCR法といった従来のクリロフ法に比べて大幅に高速であることが示された。

口頭

Acceleration of turbulent wind simulation using locally mesh-refined Lattice Boltzmann Method

小野寺 直幸; 井戸村 泰宏

no journal, , 

原子力安全保障の観点から、放射性物質の環境動態のリアルタイムシミュレーションが非常に重要である。本研究ではAMR法を用いた格子ボルツマン法に基づくCFDコードを開発した。計算コードは、最新のPascal GPUアーキテクチャで高性能を達成するように最適化されるとともに、テンポラルブロッキング法を導入することによって、MPI通信の通信量の削減に成功した。

口頭

局所細分化格子を用いた格子ボルツマン法へのテンポラルブロッキング法の適用

小野寺 直幸; 井戸村 泰宏; Yussuf, A.*

no journal, , 

放射性物質のリアルタイムシミュレーションは核セキュリティの観点から非常に重要である。都市は多くの建物や路地を含むため、その詳細な気流を解析するためには大規模なCFDの実施が必要となる。ブロックベースのAMR法に基づく格子ボルツマン法を用いることで、マルチスケールの気流解析が実現できる。計算コードはリアルタイムシミュレーションを実施するために、GPUを用いて開発を行なっている。本研究では並列計算性能の向上のために、テンポラルブロッキング法を用いた省通信型マルチタイムステップアルゴリズムを提案した。日本原子力研究開発機構のGPUクラスタ(NVIDIA P100)に対して性能測定を行なった結果、488MLUPSの非常に高い計算性能の達成および、通信量の削減が確認された。

口頭

Large-scale wind simulation using lattice Boltzmann method on GPU-Rich supercomputer

小野寺 直幸

no journal, , 

近年、低消費電力および演算性能の高さよりGPUによる科学技術計算が注目されている。本研究では、GPUを用いた格子ボルツマン法による計算コード手法を構築することで、高精度な風況解析手法を実現した。計算コードの高速化として、最新のPascalアーキテクチャに対する最適化およびテンポラルブロッキング法を用いた通信削減アルゴリズムを採用した。ノードあたり4GPUおよび2CPUを搭載するTSUBAME3.0を用いた強スケーリングの性能測定においては、1ノードで30倍、36ノードで10倍の高速化が達成された。

口頭

Porting a state-of-the-art communication avoiding Krylov subspace solver on P100 GPUs

Yussuf, A.*; 伊奈 拓也*; 小野寺 直幸; 井戸村 泰宏

no journal, , 

圧力ポアソン方程式のクリロフ部分空間法ソルバは大規模多相CFDシミュレーションにおいて全計算コストの$$sim 90%$$を占める。このポアソンソルバを加速するためにブロックヤコビ(BJ)前処理付きチェビシェフ基底共役勾配法(CBCG)ソルバをP100GPUに移植した。CBCGソルバはBJ前処理, 疎行列ベクトル積(SpMV), 非正方行列積から構成される。本研究ではスレッド・ブロック並列処理と効率的なコアレスドロードのためにBJ前処理を再設計し、非正方行列積にBatched GEMMを適用した。上記最適化により全ての主要カーネルでルーフラインに基づく理論性能の$$sim 90%$$を達成し、CPUノードに比べて一桁以上のノード性能向上が得られた。

口頭

適合細分化格子ボルツマン法による熱流動解析

小野寺 直幸; 井戸村 泰宏; Yussuf, A.*; 下川辺 隆史*

no journal, , 

福島第一原子力発電所の廃炉においては熱流動解析が重要なテーマの一つである。日本原子力研究開発機構(JAEA)では、非圧縮性Navier-Stokes方程式の解法であるJUPITERコードを用いて、デブリの空冷解析評価を行なっている。しかしながら、実機を対象とした解析の実施のためには、非常に多くの計算コストが必要となる。本研究では、GPUを用いた大規模計算に適した格子ボルツマン法に基づく熱流動解析手法であるCityLBMコードを構築している。本発表では、CityLBMコードによる自然対流実験との比較を示す。

口頭

局所細分化格子ボルツマン法を用いたオクラホマシティにおけるトレーサー拡散解析

小野寺 直幸; 井戸村 泰宏; 河村 拓馬; 中山 浩成; 下川辺 隆史*

no journal, , 

汚染物質の拡散解析はスマートシティの設計や核セキュリティの向上に重要である。都市部は複雑なビルで構成されているため、流れが乱流となり、大規模なCFD解析が必須である。我々の研究グループでは局所細分化手法を適用した格子ボルツマン法に基づくCFD解析手法を開発している。計算コードは、Pascal世代およびVolta世代の最新のGPUに対して最適化されており、高速な解析が可能である。本研究では、解析手法を用いてオクラホマシティの野外拡散実験に対する解析を行った。計算条件として、気象解析コードであるWRFに基づく風況および実際の都市部のビルデータを用いた。この解析の実施により、実験時の都市部の風況状況および汚染物質の拡散状況を良く再現していることを確認した。

13 件中 1件目~13件目を表示
  • 1