検索対象:     
報告書番号:
※ 半角英数字
 年 ~ 
 年
検索結果: 4 件中 1件目~4件目を表示
  • 1

発表形式

Initialising ...

選択項目を絞り込む

掲載資料名

Initialising ...

発表会議名

Initialising ...

筆頭著者名

Initialising ...

キーワード

Initialising ...

使用言語

Initialising ...

発行年

Initialising ...

開催年

Initialising ...

選択した検索結果をダウンロード

論文

Tree cutting approach for domain partitioning on forest-of-octrees-based block-structured static adaptive mesh refinement with lattice Boltzmann method

長谷川 雄太; 青木 尊之*; 小林 宏充*; 井戸村 泰宏; 小野寺 直幸

Parallel Computing, 108, p.102851_1 - 102851_12, 2021/12

 被引用回数:2 パーセンタイル:32.94(Computer Science, Theory & Methods)

GPUスーパコンピュータに対して格子ボルツマン法(LBM: lattice Botltzmann method)およびforest-of-octreesに基づくブロック構造型の局所細分化格子(LMR: local mesh refinement)を用いた空力解析コードを実装し、その性能を評価した。性能評価の結果、従来の空間充填曲線(SFC; space-filling curve)に基づく領域分割アルゴリズムでは、本空力解析において袖領域通信のコストが過大となることがわかった。領域分割の改善手法として本稿では挿し木法を提案し、領域分割の局所性とトポロジーを改善し、従来のSFCに基づく手法に比べて通信コストを1/3$$sim$$1/4に削減した。強スケーリング測定では、最大で1.82倍の高速化を示し、128GPUで2207MLUPS(mega-lattice update per second)の性能を達成した。弱スケーリング測定では、8$$sim$$128GPUで93.4%の並列化効率を示し、最大規模の128GPU計算では44.73億格子点を用いて9620MLUPSの性能を達成した。

論文

木構造に基づく細分化格子LBMにおける領域分割法の改善

長谷川 雄太; 青木 尊之*; 小林 宏充*; 井戸村 泰宏; 小野寺 直幸

計算工学講演会論文集(CD-ROM), 26, 6 Pages, 2021/05

Forest-of-octreesに基づく局所格子細分化法(LMR)を導入した格子ボルツマン法(LBM)に基づく空力解析コードに対し、挿し木法による領域分割の改善手法を提案した。従来の空間充填曲線に基づく領域分割法は、適合格子細分化法(AMR)やLMRで広く用いられているものの、GPUスパコン向けに実装された本空力解析コードにおいては袖領域通信が増大し計算のボトルネックとなるうることが確認された。本研究で提案する挿し木法は、粗い等間隔格子状の領域分割と細かい空間充填曲線に基づく分割のハイブリッドによる手法である。挿し木法により、領域分割の局所性と幾何形状が改善しており、通信量が従来の空間充填曲線に基づく手法に比べて3分の1に削減された。8GPU並列による性能検証では、コード全体で1.23倍の高速化が確認された。また、強スケーリングにおいてさらに性能の改善が見られ、128GPUの強スケーリングにおいては、従来手法に比べて1.82倍の高速化を示し、2207MLUPS (mega-lattice update per second)の計算性能を達成した。

口頭

細分化格子LBMに基づくLESの複数GPUによるロードレースの空力計算

長谷川 雄太; 青木 尊之*; 小林 宏充*; 白崎 啓太*

no journal, , 

自転車のロードレースの空力解析のため、大規模LES計算を実装および実行する。複数GPU計算を行うため、コヒーレント構造スマゴリンスキーモデルを導入した細分化格子LBMを用いた。単体走行および4人の集団走行の検証計算は、既往研究の実験および計算の結果とよく一致した。大規模計算のベンチマークとして72人の自転車の集団の空力解析を実施し、192GPUを用いて4日で計算を完了した。この計算コストは、応用解析に対して十分実用的である。

口頭

Tree cutting approach for reducing communication in domain partitioning of tree-based block-structured adaptive mesh refinement

長谷川 雄太; 青木 尊之*; 小林 宏充*; 井戸村 泰宏; 小野寺 直幸

no journal, , 

格子ボルツマン法を用いた空力解析を対象として、ブロック適合細分化格子法(AMR)を実装した。AMRにはforest-of-octreesに基づく木構造データを用い、領域分割法として空間充填曲線(SFC)を用いた。袖領域通信の削減のため、SFCに基づく領域分割に対して挿木法を提案した。これは、計算領域をいくつかの小領域に分割し、粗い構造格子的な領域分割と、細かいSFCによる領域分割に基づく階層的な領域分割を与える手法である。挿木法は、分割された領域の局所性を改善するとともに、袖領域の通信量および隣接プロセス数を削減することができる。Tesla V100 GPUスパコンで強スケーリングを測定したところ、挿木法により、従来のSFCに比べて1.82倍の高速化、および、128GPUで2207MLUPSの計算性能を達成した。

4 件中 1件目~4件目を表示
  • 1