検索対象:     
報告書番号:
※ 半角英数字
 年 ~ 
 年
検索結果: 28 件中 1件目~20件目を表示

発表形式

Initialising ...

選択項目を絞り込む

掲載資料名

Initialising ...

発表会議名

Initialising ...

筆頭著者名

Initialising ...

キーワード

Initialising ...

使用言語

Initialising ...

発行年

Initialising ...

開催年

Initialising ...

選択した検索結果をダウンロード

論文

Communication Reduced Multi-time-step Algorithm for Real-time Wind Simulation on GPU-based Supercomputers

小野寺 直幸; 井戸村 泰宏; Yussuf, A.*; 下川辺 隆史*

Proceedings of 9th Workshop on Latest Advances in Scalable Algorithms for Large-Scale Systems (ScalA 2018) (Internet), p.9 - 16, 2018/11

計算の高速化に向けて適合細分化格子(AMR)法を適用した格子ボルツマン法(LBM)に対して、通信削減マルチタイムステップ法(CRMT)を提案した。本手法はテンポラルブロッキング法に基づく定式化を行うことで、GPU計算で大きなボトルネックとなる通信回数の削減が可能となる。東京工業大学のTSUBAMEおよび東京大学のReedbushスーパーコンピュータにて性能測定を実施した結果、通信コストが64%に削減され、200GPUまでの弱および強スケーリング結果が改善された。以上の高速化により、2km四方の計算領域に対して1m解像度の風速5msの実時間解析が可能であることが示された。

論文

Communication avoiding multigrid preconditioned conjugate gradient method for extreme scale multiphase CFD simulations

井戸村 泰宏; 伊奈 拓也*; 山下 晋; 小野寺 直幸; 山田 進; 今村 俊幸*

Proceedings of 9th Workshop on Latest Advances in Scalable Algorithms for Large-Scale Systems (ScalA 2018) (Internet), p.17 - 24, 2018/11

多相流体CFDコードJUPITERの圧力ポアソン方程式に省通信マルチグリッド前処理付共役勾配(CAMGCG)法を適用し、省通信クリロフ部分空間法と計算性能と収束特性を比較した。JUPITERコードにおいてCAMGCGソルバ問題サイズによらずロバーストな収束特性を有し、通信削減と収束特性向上を両立することから、通信削減のみを実現する省通信クリロフ部分空間法に対する優位性が高い。CAMGCGソルバを$$sim 900$$億自由度の大規模多相流体CFDシミュレーションに適用して反復回数を前処理付CG法の$$sim 1/800$$に削減し、Oakforest-PACSにおける8,000ノードまでの良好な強スケーリングとCG法の$$sim 11.6$$倍の性能向上を達成した。

論文

Acceleration of plume dispersion simulation using locally mesh-refined lattice Boltzmann method

小野寺 直幸; 井戸村 泰宏

Proceedings of 26th International Conference on Nuclear Engineering (ICONE-26) (Internet), 7 Pages, 2018/07

放射性物質の拡散計算は、核セキュリティの観点から非常に重要である。近年、低消費電力および演算性能の高さよりGPUによる科学技術計算が注目されている。本研究では、GPUを用いた格子ボルツマン法による計算コード手法を構築することで、高精度かつ高速な風況解析手法を構築した。東京工業大学のスーパーコンピュータTSUBAMEによる弱スケーリングの性能測定を行った結果、4から144台のGPUに対して良いスケーリングが得られるとともに、CPUとの比較ではノードあたり30倍程度の性能を達成した。産業技術総合研究所の風洞実験に対する検証計算では、AMR法を適用することで全てを細かい格子で計算するのと比較して10%程度の格子点数で解析が可能となるとともに、実験による観測と良く一致している結果が得られた。

論文

Acceleration of wind simulation using locally mesh-refined Lattice Boltzmann Method on GPU-Rich supercomputers

小野寺 直幸; 井戸村 泰宏

Lecture Notes in Computer Science 10776, p.128 - 145, 2018/00

本研究では、局所細分化格子を適用した格子ボルツマン法を開発した。計算コードは、東京工業大学のGPUベースのスーパーコンピュータTSUBAME3.0を用いて開発を行い、最新のPascalアーキテクチャに対して最適化を行なった。1から36ノードを用いた弱スケーリングの性能測定では、NVIDIA TESLA P100を用いたGPU計算がBroadwellによるCPU計算の10倍以上の高速化が達成された。

論文

A Stencil framework to realize large-scale computations beyond device memory capacity on GPU supercomputers

下川辺 隆史*; 遠藤 敏夫*; 小野寺 直幸; 青木 尊之*

Proceedings of 2017 IEEE International Conference on Cluster Computing (IEEE Cluster 2017) (Internet), p.525 - 529, 2017/09

ステンシルに基づくCFDコードは、規則的なメモリアクセスを持つため、GPUで高い性能を得ることができる。しかしながら、GPUはCPUと比較して、メモリ容量が小さいため、CPUと同様の大きさの問題を解くことができない。そこで、本研究では、CPUのホストメモリとCPUのデバイスメモリの局所性を向上させることが可能な、テンポラルブロッキング法を用いることで、GPUのメモリ容量を超える大きさの計算を可能とした。本研究で開発したフレームワークでは、複雑なコーディングは必要とせずに、テンポラルブロッキング法を含む並列計算用のコードを生成できる。フレームワークを用いて開発した気流解析コードでは、TSUBAME2.5において、GPUのメモリ容量の2倍の計算規模においても、通常のメモリ容量の計算の80%程度の実効性能を達成した。

論文

A Numerical study of turbulence statistics and the structure of a spatially-developing boundary layer over a realistic urban geometry

稲垣 厚志*; 神田 学*; Ahmad, N. H.*; 八木 綾子*; 小野寺 直幸; 青木 尊之*

Boundary-Layer Meteorology, 164(2), p.161 - 181, 2017/08

 被引用回数:2 パーセンタイル:68.43(Meteorology & Atmospheric Sciences)

本研究では、東京都市部に対して、中立安定状態における大気境界層に対する数値解析を行なった。GPUを用いた並列計算を実施することで、19.2km$$times$$4.8km$$times$$1kmの領域に対して2m解像度のラージエディ・シミュレーションが可能となった。大規模計算結果より、境界層上部の乱流統計量や境界層全域におよび特徴的なストリーク構造等の再現が可能であることが確認された。

口頭

GPUを用いた燃料集合体内の詳細LES解析手法の開発

小野寺 直幸; 吉田 啓之; 高瀬 和之

no journal, , 

本研究ではラージエディ・シミュレーション(LES)による乱流モデルとグラフィックス・プロセッシングユニット(GPU)による高速化により、原子炉内の燃料集合体周りの単相流詳細熱流動解析手法開発を目的とする。LESを用いて流体方程式の定式化を行うことで、従来の熱流動解析に広く用いられているレイノルズ平均モデル計算(RANS)では捉えることのできない、乱流の非定常現象を正確に把握することが可能となる。また、GPUを用いた高速化技術により燃料集合体を模擬した大規模体系解析の非常に高速な実施が可能となる。本報では燃料集合体の形状や隣接する燃料棒の間隔がサブチャンネル内の乱流構造に及ぼす影響を数値的に調べた。その結果、サブチャンネル内において乱流に特徴的な縦渦構造が存在すること、並びにそれらの渦により燃料棒近傍を流れる流体とサブチャンネル中央部流体が激しく混合されることを定量的に明らかにした。

口頭

GPUスパコンTSUBAME2.0におけるメソスケール気象モデルとLES乱流計算

小野寺 直幸; 青木 尊之*; 下川辺 隆史*

no journal, , 

東京工業大学のスーパーコンピュータTSUBAME2.0は、グラフィックス・プロセッシングユニット(GPU)を多数導入することで2.4PFLOPSのピーク性能を有する世界有数のスーパーコンピュータである。本研究ではMPIによる並列計算ライブラリと開発言語CUDAによるGPU計算への適用を行うことで、単相乱流のラージエディ・シミュレーション(LES)コードの高速化を行った。その結果、TSUBAME2.0の64GPUを用いた計算で、1.29TFLOPの倍精度演算性能を達成した。この値はCPUに換算するとIntel Core i7 1コアが1GFlops程度の実効性能となることから、1000コア以上に相当する値である。さらに、GPUを用いた複雑物体周りのLESを行い、複雑物体周りの乱流のストリーク構造を高速に再現できることを確認した。

口頭

複数GPUを用いた複雑物体周りの乱流のラージエディ・シミュレーション解析

小野寺 直幸; 吉田 啓之; 高瀬 和之; 青木 尊之*

no journal, , 

本研究では、原子炉内熱流動解析コード整備の一環として、高精度乱流モデルであるラージ・エディ・シミュレーション(LES)、並びにLES解析に要する多大な計算時間の大幅短縮を目指してグラフィックス・プロセッシングユニット(GPU)を利用した単相乱流解析コードの開発を行っている。このコードを使って、原子炉燃料集合体を模擬した複雑物体まわりの流動解析を行い、(1)燃料集合体サブチャンネル内に発生する乱れのストリーク構造をLESによって定量的に評価できること、(2)開発中のコードはGPUを利用することでCPU計算機に比べて計算時間を約5倍短縮できること、を確認した。今後は、超臨界流体に適用できるようにコードの拡張を行い、超臨界圧軽水炉の燃料集合体内熱流動現象評価に適用する考えである。

口頭

保存型IDO法に対する高次精度風上補間関数の開発

小野寺 直幸; 青木 尊之*

no journal, , 

数値計算の離散化手法である保存型IDO法は一つの変数に対して、複数のモーメントを陽的に定義することで、狭いステンシルで高次の補間関数を構築し、高い精度を得ることが可能となる。本研究では保存型IDO法の新しい風上補間関数を提案することで、より高精度な乱流解析手法を開発する。フーリエ解析及び線形移流計算問題において、提案した補間関数は高い堅牢性と精度を合わせ持つことが確認され、また非圧縮性流体の平行平板間乱流計算においては従来提案されている風上補間関数と比べて非常に良い結果が得られた。以上のことより、本計算手法を用いることで、従来手法に比べてより少ない計算量で高い解像度の結果が得られることが確認できた。

口頭

GPUを用いた超臨界圧流体のLES解析手法の開発

小野寺 直幸; 吉田 啓之; 高瀬 和之

no journal, , 

超臨界圧軽水炉の冷却材として用いられる超臨界圧水は、擬臨界点近傍で物性値が急激に変化するため、通常の水とは異なる乱流挙動を示す。この乱流挙動により誘起される伝熱劣化現象は、被覆管温度の急激な上昇に結びつくため、超臨界圧軽水炉の熱設計における重要な問題となっている。しかし、擬臨界点近傍における乱流挙動は、そのメカニズムを含め把握されておらず、伝熱面温度測定結果との比較のみで熱設計手法の評価が行われている。本研究ではラージエディ・シミュレーション(LES)を用いた乱流解析手法を、超臨界圧水の熱流動解析に拡張することで、伝熱劣化現象のメカニズムを含めた乱流挙動を把握し、熱設計手法の評価や改良を行うことを目的とする。超臨界圧水の乱流解析の課題としては、急激な物性値変化に対応した乱流モデルがないこと、圧力場の複雑化による過大な計算付加と解析精度の低下が挙げられる。本報告では、急激な物性値変化に対応するために開発した、コヒーレント構造に基づく乱流モデルの概略を示すとともに、LESコードに組み込むことで実施した擬臨界点近傍における乱流構造の変化を含む超臨界圧水伝熱解析の結果を示す。

口頭

GPUを用いた格子ボルツマン法による固気液連成解析モデルの開発

小野寺 直幸; 大橋 訓英*

no journal, , 

荒天下での船舶の操縦性性能は安全性に直結するため、重要な研究課題の一つである。船舶の運動を詳細に解析するためには、固気液三相流に対して大規模解析を行う必要がある。本研究では格子ボルツマン法に多相流モデルを適用し解析を行った。格子ボルツマン法は連続的なメモリアクセスを行う計算手法であるため大規模計算に適した手法である。計算コードはGPUの言語であるCUDAに基づき書かれており、東京工業大学のスパコンTSUBAMEにおいて良い実行性能が得られている。また提案した多相流解析モデルは、気相と液相に対してそれぞれ独立に解析を行うことで、非定常な現象に対しても安定に解析が行うことが可能な手法である。本発表では有効性を確認するために、実際のバルクキャリアデータを読み込んだ700$$times$$120$$times$$400格子点の解析を行い、高密度比の条件下において安定な解析が行えることを示した。

口頭

格子ボルツマン法を用いた物質拡散計算の高速化

小野寺 直幸; 井戸村 泰宏

no journal, , 

汚染物質の拡散予測シミュレーションは社会的関心が非常に高く、迅速性および正確性が求められている。本研究では、格子ボルツマン法(LBM)に基づいた解析手法を構築することで、実時間拡散解析の実現を目指す。本発表では適合格子細分化法(AMR)法を適用したLBMでの最適なデータ構造および計算アルゴリズムを提案する。

口頭

適合細分化格子を用いた格子ボルツマン法による物質拡散計算

小野寺 直幸; 井戸村 泰宏

no journal, , 

汚染物質の実時間解析は核セキュリティの観点からも非常に重要である。都市部は高い建物が立ち並ぶため、乱流が発達し、大規模なCFD解析が必須となる。本研究では、適合細分化格子(AMR)を用いた格子ボルツマン法による流体解析手法を構築することで、高速かつ大規模な解析手法を構築した。従来の格子ボルツマン法では高いレイノルズの乱流解析が困難であるが、本計算では最新の衝突緩和モデルであるCummulant LBMモデルを採用することで高精度な乱流解析を実施可能とした。解析コードは産業技術総合研究所の風洞実験結果を再現可能である。さらに、AMR法を適用することで、全てを均一な格子で計算するのと比較して、10%以下の格子点にて、同様の結果が再現可能であることが示された。

口頭

Acceleration of turbulent wind simulation using locally mesh-refined Lattice Boltzmann Method

小野寺 直幸; 井戸村 泰宏

no journal, , 

原子力安全保障の観点から、放射性物質の環境動態のリアルタイムシミュレーションが非常に重要である。本研究ではAMR法を用いた格子ボルツマン法に基づくCFDコードを開発した。計算コードは、最新のPascal GPUアーキテクチャで高性能を達成するように最適化されるとともに、テンポラルブロッキング法を導入することによって、MPI通信の通信量の削減に成功した。

口頭

Large Eddy Simulation of thermal atmospheric environment in urban boundary layer

稲垣 厚志*; 小野寺 直幸; 神田 学*; 青木 尊之

no journal, , 

都市大気環境はマルチスケールの現象であるため、高解像度および広域の計算を実施する必要がある。本研究では、GPUスーパーコンピュータであるTSUBAMEを用いたラージエディ・シミュレーション手法を用いて都市大気境界層を解析することを実現した。統計量として、都市キャノピー内の値を比較することで、解析手法の妥当性を示す。

口頭

An AMR framework for realizing effective high-resolution simulations on multiple GPUs

下川辺 隆史*; 青木 尊之; 小野寺 直幸

no journal, , 

近年、複数GPU計算において、物理現象に格子解像度を適合させる計算手法が求められている。適合細分化格子(AMR)法は、それらを実現できる有効な手法である。しかしながら、GPU計算において、AMR法の実装および最適化は複雑である。本研究では、CUDAおよびC++言語を用いることで、GPU計算においてAMR法を効率的に開発可能な環境を構築した。本ライブラリを用いることで、プログラマは直交格子上のシンプルな関数を記述するだけで、GPUを利用するAMR法を開発することが可能となる。

口頭

局所細分化格子を用いた格子ボルツマン法へのテンポラルブロッキング法の適用

小野寺 直幸; 井戸村 泰宏; Yussuf, A.*

no journal, , 

放射性物質のリアルタイムシミュレーションは核セキュリティの観点から非常に重要である。都市は多くの建物や路地を含むため、その詳細な気流を解析するためには大規模なCFDの実施が必要となる。ブロックベースのAMR法に基づく格子ボルツマン法を用いることで、マルチスケールの気流解析が実現できる。計算コードはリアルタイムシミュレーションを実施するために、GPUを用いて開発を行なっている。本研究では並列計算性能の向上のために、テンポラルブロッキング法を用いた省通信型マルチタイムステップアルゴリズムを提案した。日本原子力研究開発機構のGPUクラスタ(NVIDIA P100)に対して性能測定を行なった結果、488MLUPSの非常に高い計算性能の達成および、通信量の削減が確認された。

口頭

複数GPUを用いた高精細計算を実現するAMR法フレームワークの構築

下川辺 隆史*; 小野寺 直幸

no journal, , 

近年、GPUを用いた並列計算において、適合細分化格子(AMR)法を用いた解析手法が注目を集めている。しかしながら、GPUを用いた並列計算でのAMR法の実装は煩雑であり、高い計算性能を達成するには非常に多くの開発コストが必要である。本研究では、CPU/GPU環境においても高生産なコード開発を実現可能な、AMR法に基づくフレームワークを開発している。フレームワークは単純なステンシルに基づく計算コードを書くだけで、並列のGPUコードの生成が可能となる。本発表では、AMR法のフレームワークに基づく圧縮性流体解析の結果を示す。

口頭

Xeon Phiによる共有メモリ型計算手法の数理モデルを含む船舶周り流れへの適用

大橋 訓英*; 小野寺 直幸

no journal, , 

海上技術安全研究所で開発している船舶抵抗解析のCFDコードに対して、メニーコア型のプロセッサであるIntel Xeon Phi Knights Landingに対してのポーティングおよび性能測定を実施した。2方程式モデルのRANSコードに対して重合格子を適用した計算体系の解析では、Intel Xeon Phiを利用することでコア数に応じて、スレッド並列性能が増加していくことを確認した。

28 件中 1件目~20件目を表示