検索対象:     
報告書番号:
※ 半角英数字
 年 ~ 
 年
検索結果: 40 件中 1件目~20件目を表示

発表形式

Initialising ...

選択項目を絞り込む

掲載資料名

Initialising ...

発表会議名

Initialising ...

筆頭著者名

Initialising ...

キーワード

Initialising ...

使用言語

Initialising ...

発行年

Initialising ...

開催年

Initialising ...

選択した検索結果をダウンロード

論文

木構造に基づく細分化格子LBMにおける領域分割法の改善

長谷川 雄太; 青木 尊之*; 小林 宏充*; 井戸村 泰宏; 小野寺 直幸

計算工学講演会論文集(CD-ROM), 26, 6 Pages, 2021/05

Forest-of-octreesに基づく局所格子細分化法(LMR)を導入した格子ボルツマン法(LBM)に基づく空力解析コードに対し、挿し木法による領域分割の改善手法を提案した。従来の空間充填曲線に基づく領域分割法は、適合格子細分化法(AMR)やLMRで広く用いられているものの、GPUスパコン向けに実装された本空力解析コードにおいては袖領域通信が増大し計算のボトルネックとなるうることが確認された。本研究で提案する挿し木法は、粗い等間隔格子状の領域分割と細かい空間充填曲線に基づく分割のハイブリッドによる手法である。挿し木法により、領域分割の局所性と幾何形状が改善しており、通信量が従来の空間充填曲線に基づく手法に比べて3分の1に削減された。8GPU並列による性能検証では、コード全体で1.23倍の高速化が確認された。また、強スケーリングにおいてさらに性能の改善が見られ、128GPUの強スケーリングにおいては、従来手法に比べて1.82倍の高速化を示し、2207MLUPS (mega-lattice update per second)の計算性能を達成した。

論文

ブロック型適合細分化格子でのPoisson解法の混合精度演算による高速化

小野寺 直幸; 井戸村 泰宏; 長谷川 雄太; 下川辺 隆史*; 青木 尊之*

計算工学講演会論文集(CD-ROM), 26, 3 Pages, 2021/05

本研究では、二相流体解析コードJUPITER-AMRに対して、圧力ポアソン方程式に対する混合精度前処理手法を開発した。マルチグリッド前処理手法として、3段のVサイクルの幾何学的MG法およびキャッシュを再利用したSOR(CR-SOR)法を適用した。原子力工学問題での性能測定として、バンドル体系に対する多相流体解析を実施した。計算速度として、単精度演算を適用する事で、倍精度演算の75%へと削減すると共に、強スケーリング性能においては、32台から96台のGPUを利用する事で1.88倍を実現した。

論文

機械学習による細分化格子に基づく二次元定常流予測

朝比 祐一; 畑山 そら*; 下川辺 隆史*; 小野寺 直幸; 長谷川 雄太; 井戸村 泰宏

計算工学講演会論文集(CD-ROM), 26, 4 Pages, 2021/05

多重解像度の定常流流れ場を符合付き距離関数から予測するConvolutional Neural networkモデルを開発した。高解像度の画像生成を可能とするネットワークPix2PixHDをパッチ化された高解像度データに適用することで、通常のPix2PixHDよりメモリ使用量を削減しつつ、高解像度流れ場の予測が可能であることを示した。

論文

GPU acceleration of multigrid preconditioned conjugate gradient solver on block-structured Cartesian grid

小野寺 直幸; 井戸村 泰宏; 長谷川 雄太; 山下 晋; 下川辺 隆史*; 青木 尊之*

Proceedings of International Conference on High Performance Computing in Asia-Pacific Region (HPC Asia 2021) (Internet), p.120 - 128, 2021/01

 被引用回数:0 パーセンタイル:0.01

本研究では、二相流体解析コードJUPITERに対して、マルチグリッド前処理付き共役勾配(MG-CG)法を開発した。MG法は、3段のVサイクルMG法に基づいて構築し、各段に対して、RB-SOR法およびGPUのキャッシュを再利用したCR-SORを開発・適用した。性能測定として、バンドル体系に対する気液二相流体解析を行った。RB-SOR法およびCR-SOR法を適用したMG-CG法では、MG法を適用しないPCG法と比較して、収束までの反復回数を15%と9%以下に削減するとともに、3.1倍, 5.9倍の計算速度が達成された。以上の結果から、本研究で開発したMG-CG法は、GPUを用いたスーパーコンピュータ上にて、効率的に大規模な二相流体解析が可能であることが示された。

論文

Performance portable implementation of a kinetic plasma simulation mini-app with a higher level abstraction and directives

朝比 祐一; Latu, G.*; Bigot, J.*; Grandgirard, V.*

Proceedings of Joint International Conference on Supercomputing in Nuclear Applications + Monte Carlo 2020 (SNA + MC 2020), p.218 - 224, 2020/10

エクサスケール計算機時代には、CPUやGPUの種類を問わずに高性能を発揮する性能可搬性が重要となることが予想される。発表者は、どのような技術を活用すれば運動論的モデルを採用するプラズマ乱流コードの高可搬性実装が可能となるかを調べた。運動論的コードの例として仏国CEAで開発されたGYSELAコードに着目し、当該コードを特徴付ける高次元性(4次元以上)とSemi-Lagrangianスキームといった特徴を抽出したミニアプリケーションを作成した。発表者はミニアプリケーションをOpenACC, OpenMP4.5およびKokkosを用いて並列化し、それぞれの手法の利点,欠点を調査した。OpenACCおよびOpenMP4.5は指示行を挿入することで、Kokkosは高レベルな抽象化を行うことで性能可搬実装を実現する。発表では、生産性,可読性,性能可搬性の観点からそれぞれの手法の利点,欠点を論じる。

論文

Ensemble wind simulations using a mesh-refined lattice Boltzmann method on GPU-accelerated systems

長谷川 雄太; 小野寺 直幸; 井戸村 泰宏

Proceedings of Joint International Conference on Supercomputing in Nuclear Applications + Monte Carlo 2020 (SNA + MC 2020), p.236 - 242, 2020/10

都市域の風況および汚染物質拡散は建造物や植生に強く影響されるため、従来のメソスケールモデルで記述することは困難である。この問題を解決するため、細分化格子ボルツマン法(LBM)を用いたGPUベースのCFDコードの開発を進めており、現在、数メートル解像度の汚染物質拡散のリアルタイム解析を実現している。しかし、このような高解像度のシミュレーションでは流れは極めて強い乱流状態にあり、計算結果は様々な計算条件の影響で大きく変化する。本研究では、このようなカオス状態のシミュレーションにおいて計算の信頼性を向上させるため、アンサンブル計算を実装し、不確かさの統計的評価を可能とした。開発したコードを用いてオクラホマシティにおける野外拡散実験JU2003の検証計算を行った。結果として、風況が実験とよく一致するとともに、トレーサガス濃度の平均値がアンサンブル計算と実験値の間でFactor2の条件(計算値と実験値の比が1/2から2倍の間にあること)を満たすことを確認した。

論文

GPU-acceleration of locally mesh allocated two phase flow solver for nuclear reactors

小野寺 直幸; 井戸村 泰宏; Ali, Y.*; 山下 晋; 下川辺 隆史*; 青木 尊之*

Proceedings of Joint International Conference on Supercomputing in Nuclear Applications + Monte Carlo 2020 (SNA + MC 2020), p.210 - 215, 2020/10

本研究では、ブロック型局所細分化(AMR)法に基づくPoisson解法のGPU高速化を実施した。ブロック型AMR法はGPUに適したデータ構造であり、複雑な構造物で構成された原子炉等の解析に必須な解析手法である。これに、最新の前処理手法であるマルチグリッド(MG)法を共役勾配(CG)法へと組み合わせることで、計算の高速化を実現した。MG-CG法を構成する計算カーネルをGPUスーパーコンピュータであるTSUBAME3.0上にて測定した結果、ベクトル-ベクトル和、行列-ベクトル積、およびドット積の帯域幅は、ピークパフォーマンスの約60%となり、良好なパフォーマンスを実現した。更に、MG法の前処理手法として、3段のVサイクル法および各段に対してRed-Black SOR法を適用した手法を用いて、$$453.0times10^6$$格子点の大規模問題の解析を実施した結果、元の前処理付きCG法と比較して、反復回数を30%未満に削減すると共に、2.5倍の計算の高速化を達成した。

論文

ブロック型適合細分化格子でのPoisson解法のGPU高速化

小野寺 直幸; 井戸村 泰宏; Ali, Y.*; 下川辺 隆史*; 青木 尊之*

計算工学講演会論文集(CD-ROM), 25, 4 Pages, 2020/06

原子力機構では3次元多相流体解析手法としてJUPITERを開発している。本研究では、JUPITERの圧力Poisson方程式解法として、適合細分化格子(AMR)を用いたマルチグリッド前提条件付き共役勾配法(P-CG)を開発した。計算の高速化として、全ての計算カーネルはCUDAを用いて実装すると共に、GPUスーパーコンピュータ上にて高い性能を発揮する様に最適化した。開発したマルチグリッド圧力Poisson解法は、オリジナルのP-CG法と比較して約1/7の反復回数で収束することが確認された。また、TSUBAME3.0上で8から216GPUまでの強スケーリング性能測定により、更なる3倍の高速化が達成された。

論文

自転車競技の集団走行に対する大規模空力解析

青木 尊之*; 長谷川 雄太

自動車技術, 74(4), p.18 - 23, 2020/04

LESに基づくCFD計算を用いて自転車競技の空力解析を行った。単独での走行および2$$sim$$4人の集団走行では、算出された抗力は風洞実験と良く一致した。競合する2集団の走行について、集団内の選手の配置を複数検討した。72人の選手の集団走行として、GPUスーパコンピュータで22.3億格子を用いた大規模空力解析を実施した。

論文

Inner and outer-layer similarity of the turbulence intensity profile over a realistic urban geometry

稲垣 厚至*; Wangsaputra, Y.*; 神田 学*; Y$"u$cel, M.*; 小野寺 直幸; 青木 尊之*

SOLA (Scientific Online Letters on the Atmosphere) (Internet), 16, p.120 - 124, 2020/00

 被引用回数:0 パーセンタイル:0.01(Meteorology & Atmospheric Sciences)

都市境界層を対象とした風況解析により、内層および外層のスケーリングと乱流強度分布の類似性を検討した。計算条件として、現実的な建物形状の上に発達する中立条件を仮定すると共に、計算領域19.2km$$times$$4.8km$$times$$高さ1kmに対して2m格子を設定した。乱流強度分布は計算領域内で局所的に定義できる。内層と外層に対してスケーリング則を当てはめることで、表面形状に関係なく、内層と外層内の乱流強度予測のばらつきを減らすことが可能となる。スケーリングされたプロファイル間のばらつきは、各層のスケーリングパラメーターの不一致に起因するが、長さまたは速度の比率からなる無次元パラメーターを導入することで、それらの類似性を示した。

論文

Implementation and performance evaluation of a communication-avoiding GMRES method for stencil-based code on GPU cluster

松本 和也*; 井戸村 泰宏; 伊奈 拓也*; 真弓 明恵; 山田 進

Journal of Supercomputing, 75(12), p.8115 - 8146, 2019/12

 被引用回数:1 パーセンタイル:27.54(Computer Science, Hardware & Architecture)

ジャイロ運動論的トロイダル5次元オイラーコードGT5Dにおける反復法線形ソルバの性能向上に向けて省通信一般化最小残差法(CA-GMRES)をCPU-GPUハイブリッドクラスタで実装した。CA-GMRESに加え、計算量を削減するために我々が提案した修正版CA-GMRES(M-CA-GMRES)の実装と評価も行った。本研究から、集団通信回数の最小化と密行列積演算による高効率演算というCA-GMRESの利点が実証された。性能評価は1ノードあたりNVIDIA Tesla P100 GPU4台を搭載したReedbush-L GPUクラスタで実施した。この結果、M-CA-GMRESによりCA-GMRES, 一般化共役残差法(GCR), GMRESに比べてそれぞれ1.09x, 1.22x, 1.50xの高速化が示された。

論文

GPU acceleration of communication avoiding Chebyshev basis conjugate gradient solver for multiphase CFD simulations

Ali, Y.*; 小野寺 直幸; 井戸村 泰宏; 伊奈 拓也*; 今村 俊幸*

Proceedings of 10th Workshop on Latest Advances in Scalable Algorithms for Large-Scale Systems (ScalA 2019), p.1 - 8, 2019/11

 被引用回数:6 パーセンタイル:99.23

大規模線形問題の反復法ソルバはCFDコードで共通に用いられる。前処理付共役勾配(P-CG)法は最も広く用いられている反復法の一つである。しかしながら、P-CG法では、特に演算加速環境において、大域的集団通信が重要なボトルネックとなる。この問題を解決するために、省通信版のP-CG法がますます重要になっている。本論文では多相CFDコードJUPITERにおけるP-CG法と前処理付チェビシェフ基底省通信CG(P-CBCG)法を最新のV100GPUに移植する。全てのGPUカーネルは高度に最適化され約90%のルーフライン性能を達成し、ブロックヤコビ前処理はGPUの高い演算性能を引き出すように再設計し、さらに残された袖通信のボトルネックは通信と計算のオーバーラップによって回避した。P-CG法とP-CBCG法の全体性能は大域的集団通信と袖通信の省通信特性によって左右され、GPUあたりのノード間通信帯域が重要となることが示された。開発したGPUソルバはKNLにおける以前のCPUソルバの2倍に加速され、Summitにおいて7,680GPUまで良好な強スケーリングを達成した。

論文

Fuel debris' air cooling analysis using a lattice Boltzmann method

小野寺 直幸; 井戸村 泰宏; 河村 拓馬; 上澤 伸一郎; 山下 晋; 吉田 啓之

Proceedings of 27th International Conference on Nuclear Engineering (ICONE-27) (Internet), 6 Pages, 2019/05

福島第一原子力発電所の廃炉の方法の一つとして、乾式法が挙げられる。日本原子力研究開発機構(JAEA)では、空冷性能のCFD評価手法としてJUPITERコードを開発している。しかしながら、JUPITERコードにおいて、複雑な原子炉内構造物を捉えた解析を実施するためには、非常の多くの計算資源と計算時間が必要となる。このような問題に対して、本研究ではGPUスーパーコンピュータに適した格子ボルツマン法に基づくCityLBMコードを開発している。CityLBMにてDry methodを模擬したJAEAの実験に対して検証計算を行なった結果、JUPITERコードと同様の結果が得られることが示された。また、同じ解像度および同数の並列数にて計算速度の比較を行った結果、GPUを用いたCityLBM法は、CPUを用いたJUPITERの1/6の計算時間にて解析が行えることが示された。以上の結果より、CityLBMは熱流動解析コードの有効な手法の一つであることが示された。

論文

Communication Reduced Multi-time-step Algorithm for Real-time Wind Simulation on GPU-based Supercomputers

小野寺 直幸; 井戸村 泰宏; Ali, Y.*; 下川辺 隆史*

Proceedings of 9th Workshop on Latest Advances in Scalable Algorithms for Large-Scale Systems (ScalA 2018) (Internet), p.9 - 16, 2018/11

 被引用回数:5 パーセンタイル:94.99

計算の高速化に向けて適合細分化格子(AMR)法を適用した格子ボルツマン法(LBM)に対して、通信削減マルチタイムステップ法(CRMT)を提案した。本手法はテンポラルブロッキング法に基づく定式化を行うことで、GPU計算で大きなボトルネックとなる通信回数の削減が可能となる。東京工業大学のTSUBAMEおよび東京大学のReedbushスーパーコンピュータにて性能測定を実施した結果、通信コストが64%に削減され、200GPUまでの弱および強スケーリング結果が改善された。以上の高速化により、2km四方の計算領域に対して1m解像度の風速5msの実時間解析が可能であることが示された。

論文

Acceleration of wind simulation using locally mesh-refined Lattice Boltzmann Method on GPU-Rich supercomputers

小野寺 直幸; 井戸村 泰宏

Lecture Notes in Computer Science 10776, p.128 - 145, 2018/00

 被引用回数:8 パーセンタイル:94.55

本研究では、局所細分化格子を適用した格子ボルツマン法を開発した。計算コードは、東京工業大学のGPUベースのスーパーコンピュータTSUBAME3.0を用いて開発を行い、最新のPascalアーキテクチャに対して最適化を行なった。1から36ノードを用いた弱スケーリングの性能測定では、NVIDIA TESLA P100を用いたGPU計算がBroadwellによるCPU計算の10倍以上の高速化が達成された。

論文

A Stencil framework to realize large-scale computations beyond device memory capacity on GPU supercomputers

下川辺 隆史*; 遠藤 敏夫*; 小野寺 直幸; 青木 尊之*

Proceedings of 2017 IEEE International Conference on Cluster Computing (IEEE Cluster 2017) (Internet), p.525 - 529, 2017/09

ステンシルに基づくCFDコードは、規則的なメモリアクセスを持つため、GPUで高い性能を得ることができる。しかしながら、GPUはCPUと比較して、メモリ容量が小さいため、CPUと同様の大きさの問題を解くことができない。そこで、本研究では、CPUのホストメモリとCPUのデバイスメモリの局所性を向上させることが可能な、テンポラルブロッキング法を用いることで、GPUのメモリ容量を超える大きさの計算を可能とした。本研究で開発したフレームワークでは、複雑なコーディングは必要とせずに、テンポラルブロッキング法を含む並列計算用のコードを生成できる。フレームワークを用いて開発した気流解析コードでは、TSUBAME2.5において、GPUのメモリ容量の2倍の計算規模においても、通常のメモリ容量の計算の80%程度の実効性能を達成した。

論文

A Numerical study of turbulence statistics and the structure of a spatially-developing boundary layer over a realistic urban geometry

稲垣 厚至*; 神田 学*; Ahmad, N. H.*; 八木 綾子*; 小野寺 直幸; 青木 尊之*

Boundary-Layer Meteorology, 164(2), p.161 - 181, 2017/08

 被引用回数:11 パーセンタイル:50.96(Meteorology & Atmospheric Sciences)

本研究では、東京都市部に対して、中立安定状態における大気境界層に対する数値解析を行なった。GPUを用いた並列計算を実施することで、19.2km$$times$$4.8km$$times$$1kmの領域に対して2m解像度のラージエディ・シミュレーションが可能となった。大規模計算結果より、境界層上部の乱流統計量や境界層全域におよび特徴的なストリーク構造等の再現が可能であることが確認された。

口頭

核融合シミュレーションコードのGPUクラスタにおける高性能実装

松本 和也; 朝比 祐一*; 伊奈 拓也; 井戸村 泰宏

no journal, , 

核融合プラズマ流体解析コードGT5Dの主要計算カーネルをGPUクラスタにおいて実装し、性能評価を行った結果を述べる。本研究ではコード内で性能ボトルネックとなっている反復法行列ソルバに対してGPU上でのチューニングを行い、実測性能とルーフラインモデルにより算出した達成可能な実効性能との比較をする。また、複数GPUを使用するためにGPU間直接通信技術を用いた実装についても述べる。

口頭

GPUを用いた格子ボルツマン法による固気液連成解析モデルの開発

小野寺 直幸; 大橋 訓英*

no journal, , 

荒天下での船舶の操縦性性能は安全性に直結するため、重要な研究課題の一つである。船舶の運動を詳細に解析するためには、固気液三相流に対して大規模解析を行う必要がある。本研究では格子ボルツマン法に多相流モデルを適用し解析を行った。格子ボルツマン法は連続的なメモリアクセスを行う計算手法であるため大規模計算に適した手法である。計算コードはGPUの言語であるCUDAに基づき書かれており、東京工業大学のスパコンTSUBAMEにおいて良い実行性能が得られている。また提案した多相流解析モデルは、気相と液相に対してそれぞれ独立に解析を行うことで、非定常な現象に対しても安定に解析が行うことが可能な手法である。本発表では有効性を確認するために、実際のバルクキャリアデータを読み込んだ700$$times$$120$$times$$400格子点の解析を行い、高密度比の条件下において安定な解析が行えることを示した。

口頭

HA-PACS/TCAにおけるCA-GMRES通信回避型Krylov部分空間法の実装と評価

松本 和也*; 井戸村 泰宏; 伊奈 拓也*; 真弓 明恵; 山田 進

no journal, , 

省通信クリロフ法はメニーコアプロセッサやアクセラレータに基づくスーパーコンピュータにおける通信処理のボトルネックに対する有望な解決策となっている。本研究ではGPUクラスタHA-PACSに省通信GMRES法を実装し、原子力流体コードの非対称行列ソルバに関して性能評価を実施した。評価結果から、省通信GMRES法はGMRES法やGCR法といった従来のクリロフ法に比べて大幅に高速であることが示された。

40 件中 1件目~20件目を表示