Initialising ...
Initialising ...
Initialising ...
Initialising ...
Initialising ...
Initialising ...
Initialising ...
朝比 祐一*; Latu, G.*; Bigot, J.*; 前山 伸也*; Grandgirard, V.*; 井戸村 泰宏
Concurrency and Computation; Practice and Experience, 32(5), p.e5551_1 - e5551_21, 2020/03
被引用回数:0 パーセンタイル:0.01(Computer Science, Software Engineering)2つのジャイロ運動論コード、GYSELA, GKVを最新のアクセラレータ環境、Xeon Phi KNL, Tesla P100 GPUに移植した。一台のSkylakeプロセッサーに比べ、KNLにおけるGYSELAの逐次計算カーネルは1.3x、P100 GPUにおけるGKVの逐次計算カーネルは7.4x高速化された。GYSELAとGKVのスケーリングテストをそれぞれ16-512 KNLおよび32-256 P100 GPUで実施し、GYSELAのセミラグランジアンカーネルおよびGKVの畳み込みカーネルにおけるデータ転置通信が主要なボトルネックとなることがわかった。この通信コストを削減するために、これらのコードにパイプライン法およびタスク並列法に基づく通信オーバーラップを実装した。
横川 三津夫; 斎藤 実*; 萩原 孝*; 磯部 洋子*; 神宮寺 聡*
日本計算工学会論文集, 4, p.31 - 36, 2002/00
地球シミュレータは、640台の計算ノードをクロスバスイッチで結合した分散主記憶型並列計算機である。計算オードは8つのベクトルプロセッサからなる共有メモリシステムである。ピーク性能は40Tflops,主記憶容量は10TBである。地球シミュレータ上のプログラムの実効性能を推定するための性能予測システムGSを開発した。GS
のベクトル性能の予測精度を確認するために、3グループのカーネルループに対し、GS
による予測値とSX-4の測定値を比較した結果、実行時間の絶対誤差で0.89%,1.42%,6.81%が得られた。地球シミュレータの実効性能を予測した結果、 それぞれのグループで平均5.94Gflops,3.76Gflops,2.17Gflopsが得られた。
小出 洋; 鈴木 貢*; 中山 泰一*
Concurrency; Practice and Experience, 9(9), p.897 - 914, 1997/09
被引用回数:0 パーセンタイル:0.02(Computer Science, Software Engineering)広い仮想アドレス空間を持つ共有メモリ型並列計算機のための新しい領域確保法について述べる。共有メモリ型並列計算機を効率的に使用するためには、プロセッサを停止させることなく使用することが重要である。複数のプロセッサが同時にひとつの共有変数にアクセスすると、そのアクセスは逐次化される。つまり、頻繁な共有変数へのアクセスは、並列性を減少する。特に、動的領域確保を行う応用プログラムでは、共有変数であるアロケーションポイントへのアクセスが頻繁に行われる。本論文では、アロケーションポインタが広い仮想アドレス空間中を単調増加することにより、高速な領域確保を行う方法を示す。領域確保に伴うクリティカルセクションは、効率的なfetch-and-addプリミティブを使用することで、効率的に実行できる。応用プログラムは領域確保時にほとんど停止しないため、並列性は向上される。
浅井 清
Proc. of Joint Int. Conf. on Mathematical Methods and Supercomputing for Nuclear Applications, 1, p.3 - 16, 1997/00
本国際会議は、米国原子力学会(ANS)の数学的手法及び計算分部門(Div. Math. Method & Computation)とOECD/BEAの共催によって開催するもの。ANSは、2年に1回、NEAは3年に1回の開催で、NEAの国際会議SNA(Supercomputing in Nuclear Applications)は、原研が発案しNEAの強力のもとにシリーズ化を図ったものである。今回は、米、欧、アジア地域から各1名の招待講演者のひとりとして、この2年間の当センターの研究開発活動について講演する。その内容は、並列処理用基本ソフト、数値計算ライブラリ、可視化ソフト、格子生成ソフト、ベンチマークテスト用ソフトなどである。
樋口 健二; 浅井 清; 秋元 正幸
Journal of Nuclear Science and Technology, 32(10), p.953 - 964, 1995/10
被引用回数:1 パーセンタイル:18.1(Nuclear Science & Technology)粒子輸送モンテカルロ・コードの高速処理を実現するため、モンテカルロ装置Monte-4を開発した。複雑な3次元空間における粒子の追跡計算は、スカラ命令や通常とは異なるベクトル命令を必要とするため、従来のスーパコンピュータ上での高速処理が困難であった。Monte-4は、モンテカルロ・パイプラインと呼ばれる特殊なハードウェアによってこれらの処理を高速化している。また、従来のベクトル計算機上で生じていた、データ転送能力と数値演算能力間の不均衡を解消するため、強化されたロード/ストアパイプラインを装備している。さらに、Monte-4は、4台のプロセッサによる並列処理によって高速化を実現している。汎用モンテカルロ・コードを用いた性能評価において、オリジナル・コードのスカラ処理に対し約10倍の速度向上率を達成した。
樋口 健二; 浅井 清; 秋元 正幸; 神林 奨; 徳田 伸二; 長谷川 幸弘*; 浅見 暁*; 佐々木 誠*
Comput. Assist. Mech. Eng. Sci., 1, p.191 - 204, 1994/00
粒子モデルを扱ったモンテカルロ計算等の数値シミュレーションの高速化を目指して開発されたモンテカルロ装置の設計思想、アークテクチャ及び性能評価結果について述べる。モンテカルロ装置の特長は、(1)数値演算に対するベクトル処理機能、(2)粒子分類を高速に行うための特殊パイプライン、(3)間接番地データ参照に関して強化されたロード/ストア・パイプライン及び(4)個々の粒子の振る舞いが独立であることを利用した並列処理機能にある。3つの粒子輸送モンテカルロ・コード、3次元相対論的プラズマ粒子シミュレーション・コード及び分子動力学シミュレーション・コードに対する装置の実効性能及び解析結果について述べる。
安濃田 良成; 鈴木 雅之*; 檜山 一夫*; 佐々木 繁*; 川崎 和代*; 島根 由紀夫*
JAERI-M 91-151, 51 Pages, 1991/09
ROSA計画では、加圧水型原子炉(PWR)の小破断冷却材喪失事故(LOCA)および運転時の異常時の異常な過渡変化を調べるため、実炉と同じ高さで体積が1/48の大型装置(LSTF)による模擬実験を行っている。事故時の原子炉内は、水と蒸気の混在するいわゆる二相流状態となり、特に小破断LOCAの場合には、系内の水と蒸気の分布が事象の推移や炉心冷却を支配する。LSTF実験では、様々な事故条件に関してこのような原子炉内の変化を模擬した実験を行い、実験装置内の熱水力挙動を約2300点の計測器によって詳細に計測している。これらの計測値をもとに、装置内の熱水力挙動をコンピュータ画像によってアニメーション化するシステムを開発した。このシステムは、実験結果のみならず解析結果の表示機能も有しており、解析者のためのツール並びに実験結果、解析結果のプレゼンテーション用として有効である。
川添 明美*; 南 多善*; 高野 誠; 増川 史洋; 内藤 俶孝
情報処理学会研究報告, 91(61), p.25 - 32, 1991/07
遮蔽安全評価用モンテカルロコードMCACEの並列化を行った。サンプル問題は「60Coガンマ-線源によるスカイシャイン問題」を使用した。これを高並列計算機AP1000のアーキテクチャ・ソフトウェア・シミュレータCASIMで計算時間の評価を行ったところ、400粒子8バッチを8セルで実行した場合、各セルの使用効率は、97.35%で1セルで実行した時の7.13倍計算時間が速くなった。さらに、実機AP1000での計算時間評価を行い、高速化度についても発表予定。
石黒 美佐子
Int. J. Supercomputer Appl., 5(3), p.46 - 62, 1991/00
被引用回数:1 パーセンタイル:51.41(Computer Science, Hardware & Architecture)日本のスーパーコンピュータは、ベクトル・ユニット(VU)とスカラー・ユニット(SU)で構成されている場合が多い。ここでは、SUを2台備えたデュアル・スカラー・プセッサ(DSP)VP2000シリーズ(VP2600/20など)の待行列モデルによる性能評価について述べる。(1)SUが1台と2台の場合の性能比較、(2)ハードウェアの物量が同じ場合のマルチ・プロセッサとDSPの性能比較、(3)ベクトル長が短いジョブ負荷の場合の性能分析などを、計算機へのジョブ負荷(ベクトル化率とベクトル加速率)の変動に対して解析する。ベクトル立上がり時間は、VP2600/10での実測値を参考にする。さらに、原研のジョブ負荷に対してDSPのフィージビリティを考察する。
折居 茂夫*; 樋口 健二; 浅井 清
JAERI-M 90-135, 54 Pages, 1990/08
中性子輸送モンテカルロコードKENO IVをベクトル化し、そのコードのベクトルとスカラ性能を、富士通のベクトル計算機VP-100において評価した。ベクトル化KENO IVコードには、ベクトル化アルゴリズムとしてスタックベースアルゴリズムを採用した。プログラミングテクニックとして、間接データアクセス法をこのアルゴリズムに採用した。粒子数1,800個を用いた臨界計算に対して、オリジナルKENO IVコードに対するベクトル化コードの速度向上率は、VP-100において1.9倍であった。本報告では、実際に工学計算に使用されるモンテカルロコードをベクトル化した時、良い速度向上率を得られない問題を計算機の処理構造の面からとらえ、その解析結果を述べる。
功刀 資彰*; 上田 正治*; 秋野 詔夫
日本機械学会論文集,B, 53(485), p.241 - 249, 1987/00
本報告は、液晶の散乱反射光を透過波長帯域の極めて狭い干渉フィルターによって分光し、等波長領域を取り出すことによって、種々の波長に対する等温度場を決定する方法(狭帯域フィルター法)について述べたものである。 その結果、(1)狭帯域フィルター法を画像解析を用いて実用化した,(2)校正実験の結果、本液晶膜については約29C~約34
Cの範囲で
約0.5
C以下の精度でフィルター中心波長とピーク輝度温度の関係が得られた,(3)マイクロカプセル化された液晶スペクトル特性が見出された,(4)等温線決定実験の結果、校正実験で得られた約0.1
Cの等温線の分解能がほぼ達成され、視覚では検出できなかった詳細な等温線分布が得られた。熱伝達率分布については視覚による結果と比較して誤差範囲内で一致した。
徳田 伸二; 常松 俊秀; 竹田 辰興
JAERI-M 86-159, 32 Pages, 1986/11
TRITON計画の一環として構造化プログラミングを支援するプリプロセッサEOS77を開発した。EOS77は既に開発されているEOSの上位バ-ジョンであり FORTRAN77に準拠している。さらに、EOS77は構造化プログラムを開発する上で有効ないくつかの拡張機能を備えている。このプリプロセッサ・システムは大規模計算機コ-ドを開発し利用する上で有効である。
浅井 清
原子力工業, 31(10), p.15 - 18, 1985/00
原子力コードのシステム化、数値データベース、ベクトル計算処理、光ファイバ回線による高速ネットワーク、タイムシュアリング・ネットワーク、及びワーク・ステーションの計算機利用技術の原研における導入の経緯、利用の現状をSPEEDI,ROSA IV,CASKETSS,TRITON,LIBJT60の大規模計算システムを例にとり解説した。合せてこれら諸技術の導入に必要な技術的助走期間について触れた。
浅井 清; 石黒 美佐子; 松浦 俊彦*
日本原子力学会誌, 25(3), p.164 - 171, 1983/00
被引用回数:1 パーセンタイル:22.86(Nuclear Science & Technology)最近、各国で利用され、科学技術計算分野で有効性が認められているスーパーコンピュータが、原子力分野の計算でどの程度効果が発揮できるのかについて、スーパーコンピュータの現状と私達の過去5年間にわたる調査研究結果に基づいて解説する。スーパーコンピュータの特徴、代表的な40件の原子力コードのベクトル化事例の紹介を通じて、スーパーコンピュータの原子力コードへの適応性、利用上の問題点と今後の見通しを明らかにする。
浅井 清
JAERI-M 82-200, 111 Pages, 1982/12
過去6年間原研計算センターは所内研究者、技術者、計算機メーカと協力し、ベクトル計算機、あるいは、いわゆるスーパーコンピューターによるベクトル計算処理の原子力コードへの適応性について調査、研究をおこなってきた。この間対象とした原子力コードは、2、3の重複を含め、40本にのぼる。この調査研究の結果、対象コードの約7割、全原研計算時間の7割がベクトル計算処理に適合することかわかった。これらのデータをもとに、本報告では(1)当面のヘクトル化可能討算量、(2)ベクトル計算機必要台数、(3)原子力コードのベクトル化に必要なマンパワー、(4)ベクトル計算機の持つべき演算性能、メモリ量、並行入出力パス数、入出力バッファ装置のメモリ容量と速さ、(5)ベクトル計算機運用に必要なソフトウェアと政策を明らかにし、最後に(6)原研の複合計算機システムの構成を提案する。
竹田 辰興; 常松 俊秀; 栗田 源一
JAERI-M 82-097, 64 Pages, 1982/08
TRITON計画の一環として、配列サイズに変数および算術式を許したプログラム(EOSソース・プログラム)をフォートラン・ソース・プログラムに変換するプリプロセッサ(EOSプリプロセッサ)が開発された。これは、フォートラン・ソース・プログラムをEOSソース・プログラムに変換する逆EOSプリプロセッサと合せてEOSプリプロセッサ・システムを構成する。EOSプリプロセッサを利用することによりプログラム内の配列サイズの変更が著しく容易になるので、このプリプロセッサ・システムは大規模計算機コードを開発し、利用する上で極めて有効である。本報告書は、EOSプリプロセッサ・システムの使用手引書としても利用可能である。
富山 峯秀; 浅井 清
JAERI-M 9719, 71 Pages, 1981/10
SCANは、FORTRAN構文解析プログラムであり、解析の対象となるFORTRANプログラムを1ステートメントづつ読み込み、文法のチェックを行ない、内部コード表現のステートメントに変換するものである。SCANが扱うFORTRANの言語レベルはJIS-7000を基本とし、いくつかのFORTRAN IV-Hの機能を追加したものである。本報告書ではSCANのプログラム構造と構文の解析方法、解析の過程で作成されるテーブル類について説明してある。また解析の結果作成される内部コード表現化されたFORTRAN文について述べている。SCAN自身は約5000枚のFORTRANで記述されている。FORTRANの構文解析を必要とする他の応用に対しては、SCANを少し変更することによりうまく適用できると考えている。
熊原 忠士
電子工業月報, 22(3), p.44 - 49, 1980/00
昨年10月17日から10月19日にかけて、サンフランシスコで開催されたIEEE(米国電気電子学会)主催の'79ニュークリア・サイエンス・シンポジウムの中から、CAMACとマイクロプロセサ利用に関するものを中心に概略内容を紹介した。この内容を、1.'79 NSSの概要と総会の話題,2.マイクロプロセサ利用CAMACシステム,3.一般的なCAMACシステム,4.FASTBUS関係,5.一般的なマイクロプロセサ利用機器、に分類して、21件の発表の概要をまとめた。ここでは、拡張型CAMACシステム,FASTBUS,マイクロプロセサ関係の規格など、来る1980年代に向けての新しい放射線計測器分野の標準化の動きを重点的に取り上げた。
熊原 忠士
保健物理, 15(4), p.269 - 276, 1980/00
施設管理用の放射線モニタリングシステムについて、エレクトロニクス技術の立場から、計画中のものを含む現状の動向を述べた。この結果では、放射線モニタリングの分野においても計算機利用による省力化、自動化が進んでおり、さらに、経済性や信頼性向上などの点から、多数のマイクロプロセサを使用したデジタル放射線モニタの導入が行なわれている。また、多数の放射線管理施設をもつ事業所では、事業所単位の総合的な放射線モニタリング用ネットワークシステムが必要となり、この標準化が問題となってきている。 アナログ計器主体の局部的な施設管理用放射線モニタリングから、多数の計算機による総合的なネットワークシステムへの移行の動向は、広い意味での施設放射線管理のマンマシンインターフェースの見直しが必要となってきている。
石黒 美佐子
J.Inf.Process., 3(1), p.38 - 44, 1980/00
プロセッサ・シェアリング・システムにおける平均のジョブの走行時間(running time)を推測するための解析的方法が確立された。ここで走行時間には、共存するジョブの実行によって生ずる遅れを含むものとする。プロセッサ・シェアリング機構は「init」と呼ばれる有限個の擬似プロセッサによって近似される。ここの取扱いではポアソン到着,指数サービス分布が仮定されている。以下の3通りのシステムに対して平均のジョブの遅れを含む走行時間を得るために1つの統一化された式が与えられる。(1)多重分離システム,(2)共通イニット・システム,(3)ジョブ・クラス・システム 計算結果は、シミュレーションによる結果との検証によって妥当であることが示される。
八木 秀之; 中原 嘉則; 山田 孝行; 竹内 紀男; 小山 謹二
JAERI-M 7786, 79 Pages, 1978/08
「Micro-8」マイクロ・コンピュータ・システムは、各種計測器と大型計算機を含む計算機群とを有機的に接続するためのデータ交換網を形成するために開発され、バケット交換器あるいは、端末コントローラとして利用されている。Micro-8システムは、I-8080を使用したCPUボ-ドを含め、10種類の基本回路ボードとインタフェイス・ボードから成り立っている。CPUの構造、BUSの構造、割込み制御、基本回路ボード、およびインタフェイスについて、回路ブロック図を示して解説する。基本I/O、ディジタルI/Oボード、および回線アダプタの操作について、割込要因ステイタス、I/Oマスク、データ・レジスタ等の規約と共に詳述する。回路図面、Intel-8080の資料、BUS結続表、インタフェイス接続法など、ハードウェアを利用するのに必要な資料を附録に集録した。