検索対象:     
報告書番号:
※ 半角英数字
 年 ~ 
 年
検索結果: 13 件中 1件目~13件目を表示
  • 1

発表形式

Initialising ...

選択項目を絞り込む

掲載資料名

Initialising ...

発表会議名

Initialising ...

筆頭著者名

Initialising ...

キーワード

Initialising ...

使用言語

Initialising ...

発行年

Initialising ...

開催年

Initialising ...

選択した検索結果をダウンロード

論文

C++ parallel algorithmによる性能可搬性評価

朝比 祐一; Padioleau, T.*; Latu, G.*; Bigot, J.*; Grandgirard, V.*; Obrejan, K.*

第36回数値流体力学シンポジウム講演論文集(インターネット), 8 Pages, 2022/12

本論文では、運動論的プラズマシミュレーションコードを例としてC++ parallel algorithm (stdpar)による性能可搬実装について論じる。言語標準の並列アルゴリズムstdparと抽象的高次元配列mdspanにより、可読性および生産性を損なわずに性能可搬な実装が可能であることを示す。抽象化により性能可搬性を実現するKokkosや、指示行によって性能可搬性を実現するOpenMPとの比較により、stdparの性能,可搬性,生産性などを論じる。Intel Icelake, NVIDIA V100およびA100 GPUにおいて、stdpar版のアプリケーションの性能はKokkos版に対し$$pm$$20%の範囲であった。将来的にAMDやIntel GPUにおいて利用可能になるという前提であれば、stdparはエクサスパコンにおいて有力な高生産かつ性能可搬な実装手法となり得る。

論文

Performance portable Vlasov code with C++ parallel algorithm

朝比 祐一; Padioleau, T.*; Latu, G.*; Bigot, J.*; Grandgirard, V.*; Obrejan, K.*

Proceedings of 2022 International Workshop on Performance, Portability, and Productivity in HPC (P3HPC) (Internet), p.68 - 80, 2022/11

 被引用回数:4 パーセンタイル:81.28(Computer Science, Theory & Methods)

本論文では、C++ parallel algorithmによる性能可搬な運動論的プラズマシミュレーションコードの実装について論じる。言語標準の並列アルゴリズムstdparと抽象的高次元配列mdspanにより、可読性および生産性を損なわずに性能可搬な実装が可能であることを示す。Intel Icelake、NVIDIA V100およびA100 GPUにおいて、アプリケーションの性能はKokkos版に対し$$pm$$ 20%の範囲であった。将来的にAMDやIntel GPUにおいて利用可能になるという前提であれば、C++ parallel algorithmはエクサスパコンにおいて有力な高生産かつ性能可搬な実装手法となり得る。

論文

Optimization strategy for a performance portable Vlasov code

朝比 祐一; Latu, G.*; Bigot, J.*; Grandgirard, V.*

Proceedings of 2021 International Workshop on Performance, Portability, and Productivity in HPC (P3HPC) (Internet), p.79 - 91, 2021/11

本論文では、性能可搬な運動論的プラズマシミュレーションコードのための最適化手法について論じる。まず、性能可搬ライブラリKokkosと指示行(OpenACC/OpenMP)により、単一実装でCPU、GPUで実行可能な運動論的プラズマシミュレーションコードを開発した。これに最適化を施し、Intelや富士通のCPUおよびNvidia GPUにおいて最適化の効果を評価した。その結果、OpenACC/OpenMPでは1.07倍から1.39倍の性能向上が見られ、Kokkos版では、1.00倍から1.33倍の性能向上が見られた。複数の実装による様々なカーネルの最適化手法の効果を多数のデバイスにおいて調査した本成果は、最適化手法として幅広く利用可能と言える。Kokkosは複数のデータ構造やループ構造を単一コードによって表現することに長けており、CPUとGPU両方において高い性能を発揮するために適したフレームワークであると確認した。

論文

Performance portable implementation of a kinetic plasma simulation mini-app with a higher level abstraction and directives

朝比 祐一; Latu, G.*; Bigot, J.*; Grandgirard, V.*

Proceedings of Joint International Conference on Supercomputing in Nuclear Applications + Monte Carlo 2020 (SNA + MC 2020), p.218 - 224, 2020/10

エクサスケール計算機時代には、CPUやGPUの種類を問わずに高性能を発揮する性能可搬性が重要となることが予想される。発表者は、どのような技術を活用すれば運動論的モデルを採用するプラズマ乱流コードの高可搬性実装が可能となるかを調べた。運動論的コードの例として仏国CEAで開発されたGYSELAコードに着目し、当該コードを特徴付ける高次元性(4次元以上)とSemi-Lagrangianスキームといった特徴を抽出したミニアプリケーションを作成した。発表者はミニアプリケーションをOpenACC, OpenMP4.5およびKokkosを用いて並列化し、それぞれの手法の利点,欠点を調査した。OpenACCおよびOpenMP4.5は指示行を挿入することで、Kokkosは高レベルな抽象化を行うことで性能可搬実装を実現する。発表では、生産性,可読性,性能可搬性の観点からそれぞれの手法の利点,欠点を論じる。

論文

原研高崎第2期加速器制御系

宇野 定則; 田島 訓; 高田 功; 水橋 清; 大越 清紀; 貴家 恒男; 久保田 芳男*; 河野 和弘*

第7回タンデム加速器及びその周辺技術の研究会報告集, 0, 4 Pages, 1994/00

原研高崎第2期加速器(400kVイオン注入装置、3MVシングルエンド加速器)の制御システムは、各制御コンソール上のワークステーション(W.S)とX端末からVMEbusCPUを介して現場に設置されたPLC(Programmble Logic Controller)とEthernetによって通信をしながら加速器の制御・監視を行っている。W.SのGUI(Graphical User Interface)にはX Window(OSF/motif)を採用しており、オペレータはウインド上からマウスまたはキーボードを使用して運転に必要な操作を行う。また、任意の制御対象機器を選択してロータリエンコーダで制御値の増減を行うアサイナブル・シャフトエンコーダも設置されている。本発表では、制御系の概要と操作方法および機能の紹介などを行う。

報告書

放射線管理モニタ品質規格の高度化に関する調査研究

*

PNC TJ1545 92-002, 143 Pages, 1992/03

PNC-TJ1545-92-002.pdf:3.98MB

本調査は、原子力施設で使用されている放射線管理用モニタの性能を設置時の状態を維持するために、使用者が実施する品質保証のあり方、また、近年モニタのCPU化等が進んできた現状を踏まえ、保守、校正の多様化の対処方法、について検討することにある。本年度は、放射線管理用モニタの設計から使用、運用に至る各段階で実施されている品質管理活動の実態を調査した。また、使用者が多大の経費と労力を費やして、モニタ機器類の保守、保全に当たっているが、このような状況下での故障傾向を把握した。さらに、放射線関連量のトレーサビリティに関して国内外の動向調査を実施した。

論文

On the numerical characteristics of reflood model with use of moving mesh system

渡辺 正; 久木田 豊

Numerical Modelling of Basic Heat Transfer Phenomena in Nuclear Systems, p.25 - 30, 1991/00

2次元移動メッシュ系を採用した再冠水モデルの数値解法上の特性について検討を行った。このメッシュ系では熱伝導方程式中に対流項が現れ、差分形式によっては不安定な解を得る場合がある。そこで、中心、及び風上差分と陰、及び陽解法の組み合わせに対して線型安定性解析を行った。その結果、陰解法が無条件安定となり、風上差分を行うと最も安定なスキームとなることが示された。応用例として典型的な再冠水計算を行い、温度分布に現れる不安定性が、線型安定性解析によって説明されることを確認した。また、陰解法により解が得られる場合でも、より安定な解法を用いた法が収束性が良く、CPU時間を節約できることが示された。

報告書

「Micro-8」マイクロ・コンピュータ・システム

八木 秀之; 中原 嘉則; 山田 孝行; 竹内 紀男; 小山 謹二

JAERI-M 7786, 79 Pages, 1978/08

JAERI-M-7786.pdf:2.11MB

「Micro-8」マイクロ・コンピュータ・システムは、各種計測器と大型計算機を含む計算機群とを有機的に接続するためのデータ交換網を形成するために開発され、バケット交換器あるいは、端末コントローラとして利用されている。Micro-8システムは、I-8080を使用したCPUボ-ドを含め、10種類の基本回路ボードとインタフェイス・ボードから成り立っている。CPUの構造、BUSの構造、割込み制御、基本回路ボード、およびインタフェイスについて、回路ブロック図を示して解説する。基本I/O、ディジタルI/Oボード、および回線アダプタの操作について、割込要因ステイタス、I/Oマスク、データ・レジスタ等の規約と共に詳述する。回路図面、Intel-8080の資料、BUS結続表、インタフェイス接続法など、ハードウェアを利用するのに必要な資料を附録に集録した。

報告書

FACOM230-60システムのCPUアイドルの解析

石黒 美佐子; 山田 孝行

JAERI-M 5657, 49 Pages, 1974/04

JAERI-M-5657.pdf:1.41MB

日本原子力研究所における電子計算機システムのCPU利用状況を調査研究するために、CPUアイドルが測定され解析された。CPU利用状況の詳細は、(1)ユーザCPU使用時間、(2)システム・オーバヘッド(3)I/O待時間、(4)アイドル時間に分けて示され論じられる。CPUアイドル率が約35%に達していることがわかる。CPUアイドルの原因を知るために、関連するデータが、ソフトウェア測定や会計情報から集められ、回帰分析によってシステムの一連の事象が統計的に解析される。さらに、周辺機器の使用率を、スケーラを使用頻度の高い機器に結合して、ハードウェア的に測定することを試みた。全体を通して多くの図表が示されているので、原研における最近の電子計算機の利用状況がわかる。

口頭

Accumulating knowledge for a performance portable kinetic plasma simulation code with Kokkos and directives

朝比 祐一; Latu, G.*; Bigot, J.*; Grandgirard, V.*

no journal, , 

性能可搬な運動論的プラズマシミュレーションコードの実現に向けて、単純化されたミニアプリを開発し、それを性能可搬ライブラリKokkosと指示行によってCPU, GPUで並列実行可能にした。可搬性を高めるため、Kokkosと指示行実装どちらにおいてもコードをCPUとGPUで別途実装することは避け、単一実装でCPU, GPUで並列実行可能とした。開発したミニアプリの性能を富士通A64FX, Nvidia GPUおよびIntel CPUで性能測定した。これらのアーキテクチャはエクサスケールスーパコンピュータにおいて主要な候補になっている。NvidiaやIntelにおいては良好な性能が得られたものの、A64FXにおいてはメモリの間接参照により大幅に性能が大幅劣化することが明らかとなった。講演では、可読性や生産性を高めるためのKokkosや指示行での実装方法についても論じる。

口頭

エクサスケールシステムへ向けたプラズマ乱流コードの現代化と高速化

朝比 祐一; 前山 伸也*; Latu, G.*; Garbet, X.*; 渡邉 智彦*; 青木 尊之*; 荻野 正雄*

no journal, , 

2019年度学際大規模情報基盤共同利用・共同研究拠点(JHPCN)国際共同研究のもと、仏国CEAの共同研究者とエクサスケールの核融合プラズマ乱流シミュレーションのための物理モデル開発およびHPC技術開発を行った。先進的な物理モデルとして仏国開発のGYSELAコードに運動論的電子モデルを導入し、日本において開発された同等のコードであるGT5Dコードと線形計算におけるベンチマークを行った。HPC技術開発としては、どのような技術を活用すれば運動論コードの高可搬性実装が可能となるかを調べた。特に、GYSELAコードを特徴付ける高次元性とSemi-Lagrangian schemeといった特徴を抽出したミニアプリケーションを作成し、それをOpenACCおよびKokkosにおいて並列化し、それぞれの手法の利点, 欠点を調査した。OpenACCは指示行を挿入することで、Kokkosは高レベルな抽象化を行うことで性能可搬実装を実現する。発表では、生産性, 可読性, 性能可搬性の観点からそれぞれの手法の利点, 欠点を論じる。

口頭

性能可搬な運動論的プラズマシミュレーションコードのための最適化手法

朝比 祐一

no journal, , 

性能可搬な運動論的プラズマシミュレーションコードのための最適化手法について論じる。まず、性能可搬ライブラリKokkosと指示行(OpenACC/OpenMP4.5/OpenMP)により、単一実装でCPU、GPUで実行可能な運動論的プラズマシミュレーションコードを開発した。これに最適化を施し、Intel CPUおよびNvidia GPUにおいて最適化の効果を評価した。その結果、OpenACC/OpenMPでは1.07倍から1.39倍の性能向上が見られ、Kokkos版では、1.00倍から1.33倍の性能向上が見られた。複数の実装による様々なカーネルの最適化手法の効果を多数のデバイスにおいて調査した本成果は、最適化手法として幅広く利用可能と言える。Kokkosは複数のデータ構造やループ構造を単一コードによって表現することに長けており、CPUとGPU両方において高い性能を発揮するために適したフレームワークであると確認した。

口頭

Performance portability of Ensemble Kalman Filter using C++ senders/receivers

朝比 祐一; 長谷川 雄太; Padioleau, T.*; Millan, A.*; Bigot, J.*; Grandgirard, V.*; Obrejan, K.*

no journal, , 

一般に、実稼働可能な科学シミュレーションは、計算、通信、ファイルI/Oを含む多くの異なるタスクで構成される。GPUによる計算の高速化に比べて、通信とファイルI/Oは遅くなり、大きなボトルネックになりうる。これらのコストを抑えるためには、これらのタスクを並行して管理することが非常に重要である。本講演では、通信とファイルI/Oのコストをマスクするために、言語標準C++ senders/receiversを採用する。ケーススタディとして、局所アンサンブル変換カルマンフィルタ(LETKF)を用いた2次元乱流シミュレーションコードをC++ senders/receiversを用いて実装する。LETKFでは、模擬観測データはファイルから読み込まれ、その後、MPI通信とGPU上での密行列演算が行われる。このフレームワークによる性能移植が可能なことと、非同期処理による性能向上の効果を実証する。

13 件中 1件目~13件目を表示
  • 1