FX10 FAQ
- 利用申込
- トークン
- システム全般、サービス内容
- 富士通社製コンパイラ
- GNU Compiler Collection(GCC)
- ライブラリ
- アプリケーション
- ジョブ管理システム
- グループ管理者機能について
- 利用支援ポータル・鍵登録について
- その他
利用申込について
- FX10スーパーコンピュータシステムの利用申込を行いたいのですが、申込開始日等について教えてください。
- 計算リソースに余裕がある限り随時利用申込を受付けます。FX10スーパーコンピュータシステムの利用申込書に必要事項を記入・押印の上、東京大学 情報システム部 情報戦略課 研究支援チームまでお申込ください。
- FX10 スーパーコンピュータシステムの申込や利用に際して事前に確認 (注意) する点などはありますか。
-
FX10 スーパーコンピュータシステムの申込方法や、利用方法、各種マニュアル等を用意しています。こちらで利用申込方法や、サービス内容について、ご確認ください (富士通社製の手引書やマニュアルについては、利用者限定になっています)。
・FX10 スーパーコンピュータシステム 利用コースについて
・FX10 スーパーコンピュータシステム トークンの概要について
・FX10 スーパーコンピュータシステム 利用負担金について
・FX10 スーパーコンピュータシステム 利用の手引き
(FX10 スーパーコンピュータを利用方法等の概要を説明しています。FX10 スーパーコンピュータ
システム利用方法の詳細は、利用支援ポータル内にあります手引書、マニュアルを参照してください)
- パーソナルコースに登録したいのですが、どの様なコースでしょうか。特徴など教えてください。
-
パーソナルコースは研究者が個人単位でお使いいただくためのコースで、FX10 スーパーコンピュータシステムで利用できる最大ノード数により、以下の 2 コースを用意しています。ディスク領域としては、/home の他、一時領域として外部ファイルシステム(Oakleaf-FX)、共有ファイルシステム /scratch(Oakbridge-FX)を利用できます。
コース 利用負担金(年額、税込) 利用可能
ノード数トークン ディスク量
/home大学・公共機関等 パーソナルコース1 120,000円/年 最大
24ノード25,920 ノード時間
消費係数 :
12 ノードまでは 1.00
12 ノード超過は 2.00Oakleaf-FX
200GB
Oakbridge-FX
10GBパーソナルコース2 250,000円/年 最大
96ノード51,840 ノード時間
消費係数 :
24 ノードまでは 1.00
24 ノード超過は 2.00
- グループコースに登録したいのですが、どの様なコースでしょうか。特徴など教えてください。
-
グループコースは、研究グループなどで利用されるためのコースで、12 ノード単位での申込が行えます。12 ノードで利用申込を行った場合、トークンは 103,680 ノード時間で、Oakleaf-FX についてはグループ内の利用者で共有するディスク領域 (/group、グループ内ディスク領域) として、4 TB のディスク容量が割当てられ、グループを構成するグループ内利用者ごとに /home 領域として別途 50 GB のディスク容量が割当てられます。
Oakbridge-FX については利用者ごとに /home 領域 10GB が割当てられます。また、一時領域として外部ファイルシステム(Oakleaf-FX)、共有ファイルシステム /scratch(Oakbridge-FX)を利用できます。
利用負担金(年額、税込) 利用可能
ノード数トークン ディスク量
/group
/home大学・公共機関等 企業 500,000円/年 600,000円/年 最大
1,440ノード103,680 ノード時間
消費係数 :
申込ノードまでは 1.00
申込ノード超過は 2.00Oakleaf-FX
・グループ (/group)
4TB/12 ノード
・利用者 (/home)
50GB
Oakbridge-FX
・利用者 (/home)
10GB
- グループ内ディスク領域の制限値 (QUOTA) はどの様に設定されていますか。
-
Oakleaf-FX
グループ内ディスク領域には、グループに登録されているグループ内利用者個々のディレクトリ (以下の例の場合、/group/gz00/z3000*) と、グループ内利用者が共有して利用するディレクトリ (以下の例の場合、/group/gz00/share)を用意してあります。それら全体に対しての制限値 (以下の例の場合、4TB)が設定されています。
Oakbridge-FX
グループ内利用者で共有するディスク領域はありません。申込コースに関係なく、利用者ごとに /home 領域に対して 10GB の制限値が設定されています。
- グループ管理者が必要とありますが、グループ管理者とはどの様なこと (管理) を行うのでしょうか。
-
FX10スーパーコンピュータシステムでは、バッチジョブ実行時に利用するトークンとノード数がグループ全体に割当てられますが、グループ管理者は利用者ごとに、これらの計算資源の上限値を設定・変更することができます。なお、トークン上限値、ノード数はグループに割当られた上限値を超過して変更することはできません。
グループ管理者機能
・グループ内利用者のトークン量の上限値変更 (初期値は (ユーザ設定) 無制限)
・グループ内利用者のノード数の上限値変更 (初期値は (ユーザ設定) 無制限)
- パーソナル (グループ) コースの利用者を自分のグループに追加することは可能ですか。この場合、新たに利用者番号が割り振られるのでしょうか。
- グループに追加することは可能です。ただし、既に本センターの利用者をグループに追加する場合には、現在使用している利用者番号に対してグループ追加登録処理を行いますので、新たに利用者番号を割り振ることはありません。
- FX10 スーパーコンピュータシステムに利用申込を行いましたが、既存の利用者番号が割り振られました。SR16000 システムと同様に新たな利用者番号が割り振られるのではないのでしょうか。
- FX10 スーパーコンピュータシステムでは、1 利用者に対して、1 利用者番号を割り当てます。そのため、既に FX10 スーパーコンピュータシステムに利用者番号が登録されている場合には、既存の利用者番号に新たなプロジェクト (トークン) が利用可能な状態で登録されます (新たな利用者番号は割り振られません)。
- パーソナル (グループ) コースの利用者を自分のグループに追加した場合、グループ内利用者に割り当てられる資源 (トークン、ディスク容量) はどの様に扱われますか。
-
Oakleaf-FX
新たにグループに追加登録された利用者に対しては、グループ内で利用可能なトークンの利用許可とグループ内利用者用領域に利用者ディレクトリが作成されます。また、追加登録した利用者の /home 領域に 50 GB が追加されます。ただし、グループから利用者の登録削除をした場合には、削除時点で追加されたトークン、ファイル容量は元の状態に戻ります。
グループへ利用者を追加登録する場合
グループ内利用者で共有するディスク領域はありません。また、追加登録した利用者の /home 領域に対するディスク容量の変更はありません。
- 複数のグループに登録することは可能ですか。
- 可能です。追加されるグループ代表者から利用申込を行ってください。
- グループ内利用者の /home 領域のディスク容量を追加したいのですが、可能ですか。
- Oakleaf-FX の /home 領域のみ可能です。グループ代表者からディスク量追加の利用申込を行ってください。
- グループ内利用者の /home 領域のディスク容量追加単位は、500 GB となっていますが、これらを分割して複数利用者に割り振ることは可能でしょうか。
- 複数人に分割して割り振ることはできません。
- グループの利用期限によりグループの利用が取消されますが、別のグループに所属していた場合、/home のディスク容量などはどの様になりますか。
-
Oakleaf-FX
所属しているグループ数により /home 容量は変化します。そのため、(利用が取消されたグループ数) × 50GB 分の容量が減ることになります。また、利用が取消されたグループで使用していたトークンなどの計算資源についても利用できなくなります。
[ 例 ] グループ gv10 と gz00 に登録されていたが、gv10 グループが利用取消される場合
グループの利用取消前
/home 容量の変更はありません。
- グループの利用者でしたが、登録していたグループの利用が取消されます。引き続き利用したいのですが、どの様にすれば良いでしょうか。
- 現在登録しているグループの利用期限までに、新たに、グループまたは、パーソナルコースに利用申込をお願いいたします。利用期限終了後にグループまたはパーソナルコースに申し込まれた場合、利用者番号並びに利用していたファイルの引き継ぎは行えませんのでご注意ください。
- グループコースの利用者は随時追加が可能でしょうか。
- 可能です。FX10スーパーコンピュータシステムの変更利用申込書に必要事項を記載の上、東京大学 情報システム部 情報戦略課 研究支援チームまで提出してください。
- グループコースに登録する利用者数の上限はありますか。
- グループコースに申込 (登録) する利用者数に制限はありません。ただし、利用登録者数とは関係なく、グループに割当てられるトークンは一定ですので、登録された利用者全員で使用する (トークンを消費する) ことになります。
- 申込ノード数と最大ノード数との記載があります。これらの違いについて教えてください。
- FX10スーパーコンピュータでは、申込ノード数を超えて最大ノード数まで利用するとができます。ただし、申込ノード数を超えたバッチジョブを実行した場合には、消費するトークン量が上昇します。
トークン
- トークンについて教えてください。
- トークンに関する説明やFAQを掲載している「トークンについて」のページをご覧ください。
システム全般、サービス内容
- FX10 スーパーコンピュータシステム「大規模 HPC チャレンジ」について教えてください。
- 「大規模 HPC チャレンジ」は、旧システムの HA8000 クラスタシステムで行ってきた「512 ノードサービス」、「512 ノード利用大規模 HPC 研究」と同様のサービスで、FX10 スーパーコンピュータシステム(Oakleaf-FX)がもつ最大計算ノード数 4,800 ノード (76,800 コア) を月 1 回、 1 研究グループで計算資源を専有利用することを可能とするサービスです。 利用にあたり課題審査がありますので、詳細については、FX10 スーパーコンピュータシステム「大規模 HPC チャレンジ」をご覧ください。
- 教育利用とはどのような利用方法でしょうか。
-
東京大学情報基盤センター(以下、センター)では、大学院や学部の授業において、演習用としてスーパーコンピューター資源を提供しています。
気候・流体解析・構造解析・分子科学・ナノテクノロジー・航空宇宙など、多方面の研究分野で養われた手法を用いてスーパーコンピューターを演習教材として使用する動きがあり、既に学部の専門課程及び大学院の授業では、構造解析・地球科学・流体関係の演習用としてスーパーコンピューターが使われています。
教育現場でのスーパーコンピューターの利用は、人材育成や利用の拡大に繋げられると期待できることから、センターでは、大学、高等専門学校教員が担当する大学院、大学学部、高等専門学校における講義・演習(集中講義を含む)を対象とし、申込を随時受け付けています。
「教育利用」は、学内の利用に限定せず、東京大学以外からの利用申込も受け付けています。詳細は、「教育利用」をご覧ください。
提供資源
FX10 スーパーコンピュータシステム(Oakleaf-FX)
1 ジョブあたりの最大実行時間 15 分、最大 ノード数 12 (192 コア)
- FX10 スーパーコンピュータシステムの OS、利用可能なソフトウェアについて教えてください。
- FX10 スーパーコンピュータシステムの OS、利用可能な主なソフトウェアは以下の通りです。詳細は、「FX10 スーパーコンピュータシステム の紹介」のソフトウェア構成をご覧ください。
OS
ログインノード : Red Hat Enterprise Linux
計算・インタラクティブノード : 専用 OS (XTC OS)
コンパイラ・ライブラリ
富士通社製コンパイラ (Fortran77/90、C、C++)、GCC、g95
富士通社製ライブラリ (SSL II、C-SSL II、SSL II/MPI)、BLAS、LAPACK、ScaLAPACK 等
- 利用可能なディレクトリ (ファイルシステム) について教えてください。
- 利用可能なファイルシステムは、ローカルファイルシステム、共有ファイルシステム、外部ファイルシステムの 3 ファイルシステムで構成されます。各ファイルシステムの主な特徴については、以下をご覧ください。
共有ファイルシステム (FEFS)
ログインノード、インタラクティブノード、計算ノードからアクセスすることが可能です。
Oakleaf-FX
パーソナルコースでは標準で /home 200 GB のディスク容量を利用できます。
グループコースではグループ内の利用者で共有するディスク領域 /group として申込 12 ノードあたり 4 TB のディスク容量を利用できます。また、グループを構成するグループ内利用者ごとに /home 50 GB のディスク容量を利用できます。
Oakbridge-FX
パーソナル、グループコースにかかわらず各利用者は /home 10 GBを利用できます(増量はできません)。
一時領域 /scratch については、本ディレクトリに保存されたファイルのうち、最終更新日から1ヶ月経過したファイルは毎月月末処理日に削除されます。
ローカルファイルシステム (FEFS)
ローカルファイルシステムは、バッチジョブのジョブステージング機能 (一時領域。ジョブの実行が終了した時点でファイルは削除されます) で使用できます。ジョブステージングで使用できる容量は、バッチジョブで使用するノード数により決まり、1 ノードあたり約 200 GB です。例えば 12 ノードジョブの場合、約 2.4 TB の容量がステージング領域として使用できます。
外部ファイルシステム (FEFS) ※ Oakleaf-FX のみ
外部ファイルシステムは、ログインノード、インタラクティブノード、計算ノードからアクセスすることが可能です。本ディレクトリに保存されたファイルのうち、最終更新日から 9ヶ月間以上経過したファイルは、毎月月末処理日に削除されます。
- 3つファイルシステムがありますが、全て同じファイルシステムですか?
- 外部ファイルシステムも含め、全て FEFSファイルシステムです。(運用開始当初の外部ファイルシステムは、Lustreファイルシステムでしたが、性能に影響を与えることがあるため、2013年8月28日より、FEFSファイルシステムに変更しています。)
- 利用可能なディレクトリ (ファイルシステム) を利用するにあたり、注意するべき事項等はありますか。
- ホームディレクトリをはじめとする FX10 スーパーコンピュータシステムで利用可能なすべてのファイルシステムにおいて、本センターでは、作成されたデータなどはバックアップなどの取得は行っておりません。利用者の皆様でバックアップの取得等をお願いいたします。
- FX10 スーパーコンピュータシステムに、SR16000システムのファイルシステムがマウントされてるのでしょうか。
- SR16000システムのファイルシステムとのファイル共有は行っておりません。必要に応じて、SR16000システムからのファイルコピーをお願いいたします。
- ログインシェルは変更可能でしょうか。
- chsh コマンドにて変更可能です。標準では、ログインシェルを bash に設定しています。
- " .... command not found "というメッセージが出て、コマンドを受け付けないのですが。
- コマンドパス等を設定する .bashrc や.bash_profile ファイルがあり、このファイルの中の記述がおかしくなってしまうと、正しい設定が行われなくなり、標準的なコマンドも使えなくなってしまうことがあります。ファイルの中の記述を確認してください。
- .bashrc や.bash_profile ファイルを初期状態としたいのですが、センター標準の雛形はありますか。
- ログインノードの /etc/skel にありますので必要に応じてファイルコピーをお願いいたします。
- サンプルプログラム等はありますか。
- 利用手引書にあるサンプルプログラム、シェルスクリプト等について、ログインノードの /usr/local/example にまとめてありますので、参考にしてください。
- FX10 スーパーコンピュータを利用しています。出力されるエラーメッセージについて、どのマニュアルを参照すれば良いでしょうか。
-
以下に、主に出力されるエラーメッセージについての参照すべきマニュアルを記載しておりますので、ご確認ください。また、これ以外で不明なエラーメッセージや内容等があれば、プログラム相談票に必要事項をご記入の上、本センター相談受付(
)までご連絡下さい。
エラーメッセージ 参照マニュアル ERROR: SIMXXXX : XXXXXX FX10 スーパーコンピューターシステム
Oakleaf-FX / Oakbridge-FX 利用手引書[ERR.] PJM XXXX
[INFO] PJM XXXX
[ERR.] PRM XXXX
[WARN] PRM XXXX
[INFO] PRM XXXX
[ERR.] PLE XXXX
[INFO] PLE XXXXジョブ運用ソフトウェア エンドユーザ向けガイド jwdXXXX Fortran 翻訳時メッセージ jweXXXX Fortran/C/C++ 実行時メッセージ xpfrtpx
jesXXXX
jooXXXXXPFortran 使用手引書 [mpi::XXX::XXX] MPI 使用手引書 JNOXXXX SSL II/MPI 使用手引書 RTINFXXXX 実行時情報出力機能使用手引書 fipp プロファイラ使用手引書 fast_dd-error: XXXX 高速 4 倍精度基本演算ライブラリ使用手引書
富士通社製コンパイラ
- Fortran コンパイラの仕様について教えてください。
-
富士通社製 Fortran コンパイラの仕様は以下の通りです。
- C、C++ コンパイラの仕様について教えてください。
-
富士通社製 C、C++ コンパイラの仕様は以下の通りです。
- コンパイラのバージョンアップ情報について確認する方法はありますか。
- 利用支援ポータルでコンパイラのバージョンアップ情報を記載していますのでご確認ください。
- デバッガ・プロファイラなどはありますか。
- デバッガ・プロファイラとして、「プログラミング支援ツール」を用意しています。詳細は、利用手引書、プログラミング支援ツールマニュアル、デバッガ使用手引書、プロファイラ使用手引書をご覧ください。
- プログラミング支援ツールとはどの様なものでしょうか。
- アプリケーションプログラム開発の各種作業フェーズを支援する GUI 開発環境です。独自のファイルエクスプローラやエディタをはじめ、デバッガ、プロファイラなど高機能の開発ツールを実装しています。詳細は、利用手引書、プログラミング支援ツールマニュアル、デバッガ使用手引書、プロファイラ使用手引書をご覧ください。
- プログラム支援ツールを利用したいのですが、どの様に利用すれば良いでしょうか。
- 利用支援ポータルより、プログラム支援ツールをダウンロードできます。お使いの PC にインストールしてご利用下さい。詳細は、利用手引書をご覧ください。
- プログラミング支援ツールを Mac OS で利用したいのですが、利用できますか。
-
Mac OS X で利用可能です。プログラミング支援ツール(プロファイラ、デバッガ)は、下記の OS をサポートしています。UNIX/Linux 端末でプロファイラ、デバッガを使用する場合には、ログインノードにログインして、システム提供 (CLI 版) をご利用ください。
・Mac OS X (Adobe AIR の最新版が動作する環境)
・Windows Vista SP2 (32bit 版)
・Windows 7 (32bit 版、64bit 版)
- Boost ライブラリは使用可能でしょうか。
- 可能です。
- 実行時エラー(領域外アクセス、メモリ開放エラーなど)が発生した場合に、デバッグする方法を教えてください。
- 以下のコンパイルオプションを指定し、デバッグ機能を有効にしてください。
FORTRAN
-Nquickdbg[=dbg_arg]
dbg_arg={{argchk|noargchk}|{subchk|nosubchk}|{undef|undefnan|noundef}|{inf_detail|inf_simple}}
・実行時エラーが発生した場合のデバッグに有効なオプションです。
-N{setvalue[=set_arg]|nosetvalue}
・コンパイル時に指定された検査を実行し、実行時にも指定された検査を実行します。
set_arg = {{heap|noheap}|{stack|nostack}|{scalar|noscalar}|{array|noarray}|{struct|nostruct}}
・変数の初期化を行っていない場合のデバッグに有効なオプションです。
・ヒープ領域またはスタック領域にゼロ値を自動的に設定するか否かを指示します。
※ -Nsetvalueオプションと同時に-Nquickdbgオプションを指定した場合、-Nsetvalueオプションは無効となります。
デバッグ検査機能の詳細は、利用支援ポータル内にある「Fortran使用手引書 - 8.2.1 デバッグを行うための検査機能」を参照してください。
C/C++
-Nquickdbg[=dbg_arg]
dbg_arg={subchk|nosubchk|heapchk|noheapchk|inf_detail|inf_simple}
・実行時エラーが発生した場合のデバッグに有効なオプションです。
-N{setvalue[=set_arg]|nosetvalue}
・コンパイル時に指定された検査を実行し、実行時にも指定された検査を実行します。
set_arg = {heap|noheap}, {stack|nostack}, {scalar|noscalar}, {array|noarray}, {struct|nostruct}
・変数の初期化を行っていない場合のデバッグに有効なオプションです。
・ヒープ領域またはスタック領域にゼロ値を自動的に設定するか否かを指示します。
※ -Nsetvalueオプションと同時に-Nquickdbgオプションを指定した場合、-Nsetvalueオプションは無効となります。
デバッグ検査機能の詳細は、利用支援ポータル内にある「C/C++言語使用手引書 - 8.1 デバッグのための検査機能」を参照してください。
GNU Compiler Collection(GCC)
- GNU Compiler Collection(GCC)を使用したいのですが利用可能でしょうか。また、どのノード群で利用可能でしょうか。
- ログインノード、計算・インタラクティブノードで利用可能です。
- GCC は SPARC64IXfx の拡張命令 (HPC-ACE) をサポートしていますでしょうか。
- サポートしていません。
- GCC を利用していますが、実行速度が遅いです。
- 上記の通り、SPARCK64IXfx の拡張命令 (HPC-ACE) をサポートしていません。そのため FX10 スーパーコンピュータシステムの本来の性能を発揮するためにも、富士通社製コンパイラの使用をお願いいたします。
ライブラリ
- 富士通社製ライブラリが提供されるのでしょうか。
-
富士通社製ライブラリとして、以下のライブラリを提供しています。
・SSL II (Scientific Subroutine Library II)
・C-SSL II
・SSL II/MPI
- SR16000 システムで使用していた、日立製作所製ライブラリ (MATRIX/MPP、MATRIX/MPP/SSS、MSL2) は利用できますか。
- 利用できません。富士通社製ライブラリをご使用ください。
- 富士通社製ライブラリのほかにどの様なライブラリが利用できるのでしょうか。
- 以下のライブラリを提供しています。
BLAS,LAPACK,ScaLAPACK,FFTW,SuperLU,PETSc,METIS,SuperLU_DIST,Parallel NetCDF
- METISについて、並列版も用意されていますか?
- ParMETIS が利用可能です。
- 提供されているライブラリ、アプリケーションのバージョンを教えてください。
-
センターで提供しているライブラリ、アプリケーションのバージョンは以下の通りです(2014年4月現在)。また、module コマンドでバージョン情報等を取得することが可能です。module コマンドの利用方法については、利用手引書をご覧ください。なお、アプリケーションについてはログインノードと計算・インタラクティブノード群で提供内容が異なります。詳細は、「FX10 スーパーコンピュータシステム の紹介」のソフトウェア構成をご覧ください。
ライブラリ、アプリケーション バージョン BLAS
LAPACK
ScaLAPACK
FFTW
boost
METIS
ParMETIS
SuperLU
SuperLU_DIST
Parallel NetCDF
NetCDF (C 言語版)
NetCDF (Fortran、C++ 版)
OpenFOAM
ABINIT-MP
PHASE
FrontFlow/blue
FrontISTR
REVOCAP Coupler
REVOCAP Refiner
PETSc-
3.2.2
1.8
3.3
1.47.0
5.1.0
4.0.3
4.3
3.3
1.3.1
4.2.1.1
4.2
2.2.2
4.1
11.00
8.1
4.2a
2.0
1.1.01
3.4.3
インタラクティブノードでの実行例
[z30000@oakleaf-fx-1 ~]$ pjsub --interact : [z30000@インタラクティブノード ~]$ module avail ------------------ /usr/local/share/Modules/modulefiles/apps ------------------- ABINIT-MP/4.1(default) PETSc/3.3-p4 FrontFlow_blue/7.1 PETSc/3.4.3(default) FrontFlow_blue/8.1(default) PETSc-CPP/3.4.3(default) FrontISTR/3.2 PETSc-CPP-complex/3.4.3(default) FrontISTR/4.2a(default) PETSc-complex/3.3-p4 OpenFOAM/2.1.0 PETSc-complex/3.4.3(default) OpenFOAM/2.2.0 PHASE/11.00(default) OpenFOAM/2.2.1 PHASE/7.0.1 OpenFOAM/2.2.2(default) gromacs/4.6.3(default) PETSc/3.0.0 gromacs-single/4.6.3(default) ------------------ /usr/local/share/Modules/modulefiles/utils ------------------ GCC/4.2.4 TCSuite/GM-1.2.1-02 GCC/4.6.1(default) TCSuite/GM-1.2.1-03 Java/openjdk7(default) TCSuite/GM-1.2.1-04 Perl/5.18.1(default) TCSuite/GM-1.2.1-05 Python/2.7.5(default) TCSuite/GM-1.2.1-06 Python/3.3.2 TCSuite/GM-1.2.1-07 Ruby/2.0.0(default) TCSuite/GM-1.2.1-08(default) TCSuite/GM-1.2.0-02 TCSuite/TEST-1.2.1-05a TCSuite/GM-1.2.0-03 g95/0.92(default) TCSuite/GM-1.2.0-05 gdb/6.6(default) TCSuite/GM-1.2.1-01 mpiJava/1.2.7(default) ------------------ /usr/local/share/Modules/modulefiles/libs ------------------- HDF5/1.8.12(default) SuperLU_DIST/3.0 HDF5/1.8.9 SuperLU_DIST/3.1 METIS/4.0.1 SuperLU_DIST/3.3(default) METIS/4.0.3 SuperLU_MT/2.1(default) METIS/5.0.2 boost/1.47.0(default) METIS/5.1.0(default) fftw/3.3(default) PHDF5/1.8.12(default) fftw_org/3.3(default) PHDF5/1.8.9 netCDF/4.1.1 ParMETIS/3.1.1 netCDF/4.2 ParMETIS/4.0.2 netCDF/4.2.1.1(default) ParMETIS/4.0.3(default) netCDF-cxx/4.2(default) REVOCAP_Coupler/1.5 netCDF-fortran/4.2(default) REVOCAP_Coupler/2.0(default) parallel-netcdf/1.2.0 REVOCAP_Refiner/1.0.0 parallel-netcdf/1.3.1(default) REVOCAP_Refiner/1.1.01(default) pnetCDF/4.2.1.1(default) SuperLU/4.1 pnetCDF-cxx/4.2(default) SuperLU/4.3(default) pnetCDF-fortran/4.2(default)
- センターで提供されているアプリケーション、ライブラリを利用したいのですが、環境変数の設定 (利用) 方法について教えてください。
-
module コマンドにより、アプリケーションやライブラリの利用時に必要な環境変数を設定することができます。詳細については、利用手引書をご覧ください。
[z30000@oakleaf-fx-1 ~]$ module list 利用環境の確認 Currently Loaded Modulefiles: 1) TCSuite/GM-1.2.0-03
[z30000@oakleaf-fx-1 ~]$ module load SuperLU 利用環境の設定 (例では SuperLU)
[z30000@oakleaf-fx-1 ~]$ module list 利用環境の確認 Currently Loaded Modulefiles: 1) TCSuite/GM-1.2.0-03 2) SuperLU/4.1 < - SuperLU が load された [z30000@oakleaf-fx-1 ~]$ env | grep Super 環境変数の確認 LIBRARY_PATH=/usr/local/SuperLU/4.1/lib FORT90CPX=-I/usr/local/SuperLU/4.1/include ~ INCLUDE_PATH=/usr/local/SuperLU/4.1/include :
- センターで提供されている BLAS/LAPACK/ScaLAPACK は、NetLIB で公開されているものと同一のものでしょうか。
- センターで提供している BLAS (Basic Linear Algebra Subprograms)、LAPACK (Linear Algebra PACKage)、ScaLAPACK (Scalable LAPACK) は FX10 (SPARC64 IXfx) 向けにチューニングしたライブラリを提供しています。詳細については、利用手引書をご覧ください。
- BLAS (LAPACK、ScaLAPACK) の利用方法を教えてください。
-
以下のオプションを指定してコンパイル (LINK) してください。詳細については、利用手引書をご覧ください (富士通社製 C/C++ コンパイラにて数学ライブラリを使用する場合、数学ライブラリの製品マニュアルに記載されている注意事項も合わせてごご覧ください)。
ライブラリ LINK 方法 備考 BLAS 逐次 -SSL2 スレッド並列 -SSL2BLAMP LAPACK 逐次 -SSL2 スレッド並列 -SSL2BLAMP ScaLAPACK MPI 並列 -SCALAPACK LINK する BLAS/LAPACK に応じて、-SSL2
または -SSL2BLAMP を指定する
- ライブラリ (xxxx) を利用したいのですが、利用方法について教えてください。
- 利用支援ポータル内にある「FX10 スーパーコンピューターシステム Oakleaf-FX / Oakbridge-FX 利用手引書」を参照してください。また、富士通社製のライブラリについては、上記マニュアル以外にも専用マニュアルが用意されているものもありますので、そちらも参考にしてください。
アプリケーション
- FX10 スーパーコンピュータで利用可能なアプリケーションとしては、どのようなものがあるのでしょうか。
- 計算・インタラクティブノードで、OpenFOAM や PHASE などのアプリケーションが利用可能です。詳細は、「FX10 スーパーコンピュータシステム の紹介」のソフトウェア構成をご覧ください。
- OpenFOAM を含め、FX10 スーパーコンピュータシステムで提供されているアプリケーションソフトウェアを自分でビルドしたいのですが、参考までに、どの様にビルドしたか (オプションなど) 教えて頂けないでしょうか。
- OpenFOAM など FX10 スーパーコンピュータシステムで提供している各種アプリケーションのビルド手順は利用支援ポータルのメニュー「ツール」から「OSS (Open Source Software) 構築手順」をご覧ください。
- 提供されているアプリケーションのバージョンを教えてください。
- 「Q 提供されているライブラリ、アプリケーションのバージョンを教えてください。」の項目をご覧ください。
- 提供されているアプリケーション (xxxx) を利用したいのですが、利用方法について教えてください。
- 利用支援ポータル内にある「FX10 スーパーコンピューターシステム Oakleaf-FX / Oakbridge-FX 利用手引書」を参照してください。
- 個別に購入したソフトウェアを使用することはできますか。
- 利用者ディレクトリにインストールして使用する場合には、ライセンス等をご確認の上、ご使用頂いても問題ありません。
ジョブ管理システム
- FX10 スーパーコンピュータシステムで利用可能なジョブ管理システムの名称はなんでしょうか。
- FX10 スーパーコンピュータシステムで利用可能なジョブ管理システムの名称は PJM です。
- FX10 スーパーコンピュータシステムで利用可能なジョブ管理システムは、SR16000 システムで利用しているジョブ管理システムとの互換性はありますか。そのまま動作しますか。
- FX10 スーパーコンピュータシステムで利用可能なジョブ管理システムは従来から利用してきたジョブ管理システム (NQS 互換機能) とは互換性はありません。お手数ですが、FX10 スーパーコンピュータシステム用に書き換えをお願いいたします。
- ジョブクラスにはどの様な種類がありますか。
- パーソナルコースの登録コースにより利用できる最大ノード数が異なる以外は、全てのコースで利用可能なジョブクラスは共通となっています。詳しくは、「ジョブクラス」を参照してください。
- 投入できるジョブクラスを確認するコマンドはありますか。
-
pjstat --rsc コマンドで確認することができます。詳しくは、利用支援ポータル内にある以下のマニュアルを参照してください。
・FX10 スーパーコンピューターシステム Oakleaf-FX / Oakbridge-FX 利用手引書
「ジョブ状態表示(pjstat コマンド)」
- ジョブの最大投入数、最大同時実行本数について教えてください。
-
ご利用になられているコース (パーソナル、グループコース) により異なりますので、下記の表でご確認ください。また、グループコースの利用者様については、グループ管理者による制限により、利用可能な最大ノード数が下記の表とは異なる場合があります。
パーソナルコース グループコース 1 2 ユーザ単位 グループ単位 最大投入数 8 16 制限なし 最大同時実行本数 × 4
12 ノードの場合は 48
24 ノードの場合は 60最大同時実行
本数2 4 制限なし 申込ノード数が 12ノードの場合は 12本
24ノードの場合は 15本
以降24ノード単位で3本づつ追加される最大ノード数
(ジョブ単位)24 96 グループ管理者が設定していない場合は 最大ノード数 (1,440ノード) まで利用可能 1,440
ただし、debugキューについては、実行待ち時間が長期化することを回避するため、利用者1人当たりのジョブの最大投入数を10(パーソナルコース1を除く)としています。
- ジョブの最大投入数を変更して頂けないでしょうか。
- ジョブの最大投入数や最大実行本数は申込されているコース・利用申込ノード数により決まっています。そのため、ジョブの最大投入数制限を変更することはできません。代替の手段として、オープンソースソフトウェア Xcrypt の利用をご検討下さい。Xcrypt は最大投入数を超えたジョブの投入を指示することで、計算中のジョブが終了する度に自動的にジョブ管理システムへジョブを投入することが可能です。
Xcryptについては本センターの講習会で使用された以下の資料を参照してください。
・Xcryptを用いたジョブ並列処理
- ジョブの最大投入数などを確認する方法はありますか。
-
ジョブの最大投入数などは pjstat --limit で確認することができます。詳細は、利用支援ポータル内にある以下のマニュアルを参照してください。
・FX10 スーパーコンピューターシステム Oakleaf-FX / Oakbridge-FX 利用手引書
「ジョブ状態表示(pjstat コマンド)」
- バッチジョブ、インタラクティブジョブの起動方法について教えてください。
-
バッチジョブの投入は pjsub コマンドで行います。インタラクティブジョブは pjsub コマンドに --interact オプションを付加します。pjsub コマンドの詳細は、利用支援ポータル内にある以下のマニュアルを参照してください。
・FX10 スーパーコンピューターシステム Oakleaf-FX / Oakbridge-FX 利用手引書
「バッチジョブ投入(pjsub コマンド)」
・ジョブ運用ソフトウェア エンドユーザ向けガイド
- ジョブスクリプトを作成する上で、必要となる主なオプション等について教えてください。
-
ジョブスクリプト内で指定する主なオプション (指定方法) は以下の通りです。詳細は、利用支援ポータル内にある、以下のマニュアルを参照してください。
・FX10 スーパーコンピューターシステム Oakleaf-FX / Oakbridge-FX 利用手引書
スクリプト内での記述方法
・ジョブ運用ソフトウェア エンドユーザ向けガイド指定方法 意味 #PJM -L "rscgrp=キュー (リソースグループ)" キュー (リソースグループ) を設定 #PJM -L elapse=hh:mm:ss 経過時間の設定 #PJM -L node=node数 ノード数の設定 #PJM -g "グループ (プロジェクトコード)" ジョブ実行時に使用するトークンを指定 #PJM -j 標準エラー出力を標準出力へマージ #PJM -s ジョブ統計情報を出力
バッチジョブスクリプト指定 (実行) 例
- ジョブスクリプトを作成する上で、SR16000 システム (NQS 互換機能) では、ジョブの投入ディレクトリ等についてジョブスクリプト内の環境変数で指定することができました。PJM でも指定することが可能でしょうか。
-
可能です。PJM で設定される主な環境変数は以下の通りです。
- ジョブ実行時に確保される計算ノード群の形状を指定することが可能でしょうか。可能な場合には、どの様に指定すればよいですか。
-
1 次元・2 次元・3 次元の指定が可能です。ジョブスクリプト内に以下の指定をしてください。
#PJM -L "node=96" ノード数の指定 (1 次元) #PJM -L "node=6x16" ノード数の指定 (2 次元) #PJM -L "node=2x6x8" ノード数の指定 (3 次元)
計算ノードの利用効率の向上を図るため、
・ジョブクラス debug および short
・ジョブクラス regular(small)で要求ノード数が 72 以下
に該当するジョブでは、2 次元または 3 次元形式の形状指定を禁止といたします(ジョブ投入時の「-L node=」の指定で 2 次元または 3 次元の形状のジョブは投入が出来なくなります)。
2 次元または 3 次元の形状指定は、その形状を保証するために要求したノード数を超える数のノードが確保される場合が多く、このためジョブの実行に使用されないノードを多数生じることとなり、他のジョブの実行の妨げとなっています。このため、小規模ジョブについては形状指定を禁止することとしました。
なお、今回、形状指定を禁止されない中・大規模ジョブにつきましても、性能評価などで特に形状指定を必要とするジョブ以外は、形状を自動的に最適化して割り当てることができる 1 次元指定(-L node=N)をお願いします。
- ノード (Tofu) の形状 (XYZabc) について教えてください。
-
XYZabc の順に 10 x 5 x 8 x 2 x 3 x 2 (Oakleaf-FX)、2 x 3 x 8 x 2 x 3 x 2 (Oakbridge-FX) となっています。Tofu の詳細については、以下を参照してください。
・スーパーコンピューティングニュース 3 月号
「大規模超並列スーパーコンピューターシステム PRIMEHPC FX10 の特長」
・FX10 スーパーコンピューターシステム Oakleaf-FX / Oakbridge-FX 利用手引書
「スケーラブル・高可用性6次元メッシュ/トーラス」
- ジョブを投入しようとしたら、以下のメッセージが出力され、ジョブの投入が拒否されました。
-
【Case 1】SIM4307 エラーが出力された
pjsub: ERROR: SIM4307: Two or more projects are assigned to your account. Specify one project with -g option(your projects: "グループ名" "グループ名").
複数グループに所属している方がジョブを投入する場合、ジョブを実行するグループの指定 (トークンを消費するグループ)の指定が必要です。グループの指定は pjsub -g オプション (#PJM -g "グループ(プロジェクトコード)") を指定してください。
詳しくは、ジョブ管理システム 「ジョブスクリプトを作成する上で、必要となる主なオプション等について教えてください。」を参照してください。
【Case 2】SIM4305 エラーが出力されたpjsub: ERROR: SIM4305: specified node is over limitation(XXX > YY).
パーソナルコースで登録されている場合で、許可されているノード数を超えて指定した場合に、上記のメッセージが出力されます (上記のメッセージ XXX 部分には、指定 (要求) したノード数、YY 部分には許可されているノード数 (コース 1 の場合は 24、コース 2 の場合は 96 )が表示されます。許可されているノード数以内に変更して、ジョブを再投入してください。
詳しくは、ジョブ管理システム 「ジョブの最大投入数、最大同時実行本数について教えてください。」を参照してください。
【Case 3】SIM4010 エラーが出力されたpjsub: ERROR: SIM4010: Number of nodes is out of range: XXXX
許可されたジョブクラスの最大ノード数を超えてジョブを投入しようとした場合に、上記のメッセージが出力されます。ジョブクラスで許可されているノード数以内に変更して、ジョブを再投入してください。
例:small でノード数 1000 を指定した場合
詳しくは、ジョブ管理システム 「ジョブクラス」を参照してください。
→ small で実行可能なノード数は 12 ~ 216 のため、1000 ノード確保できずにエラーとなる。
[z30000@oakleaf-fx-1 ~]$ pjsub -L rscgrp=small,node=1000 -g gz00 go.sh pjsub: ERROR: SIM4010: Number of nodes is out of range: 1000. Specify number of nodes from 12 to 216.
【Case 4】PJM 0005 エラーが出力された[ERR.] PJM 0005 pjsub Resource value is out of range: node
本センター相談受付(
)まで、以下の内容を記載の上、お手数ですが、ご連絡ください。
・氏名、所属、連絡先、利用者番号、グループ名
・発生日 (操作日時)
・投入したジョブスクリプトの内容
・行った操作など、再現方法・再現環境などのプログラム相談票に記載している内容
【Case 5】SIM4302 エラーが出力されたpjsub: ERROR: SIM4302: The amount of estimated consumed-token is over remaining token. Try `show_token' for token information.
割当トークン量を全て使用していた場合や、割当トークン量を超過することが見込まれるジョブを投入した場合に出力されます (割当トークン量や使用したトークン量などについては、show_token コマンドで確認できます。なお、割当トークン量を超過した場合でも、ログインノードへのログインやインタラクティブジョブの実行は可能です)。ジョブ実行を引き続き行いたい場合には、トークン量の追加が必要です。
詳しくは、「トークンについて」を参照してください。
パーソナルコースをご利用の場合
トークンの追加購入をご検討ください (追加には、利用負担金が発生します)。トークンの追加は、システム資源に余裕がある場合にのみ受付 (追加申込) を行っていますので、トークンの追加が可能かについては、受付()までお問い合わせください。なお、トークンは、利用を許可された期間内にトークン全量を利用できることを保証するものではありません。追加するトークン量等については十分ご確認ください。
グループコースでご利用の場合
●グループ利用者
グループコースの場合、グループ全体でトークン量を超過している場合や、グループ管理者により利用者のトークン量が制限されているなどの場合がありますので、グループ管理者までご確認ください (制限が行われているかどうかについては、show_token コマンドでも確認できます)。
●グループ管理者
グループ全体で割当トークン量を超過している場合は、パーソナルコース利用者と同様に、(グループ全体の) トークンの追加購入をご検討ください。グループ利用者に対して、グループ管理者機能によるトークン量の制限を行っている場合で、グループ利用者に追加トークンを許可した場合には、トークン量の追加処理を行った時点で再度ジョブ実行が可能となります (トークン量の変更方法については、FX10 スーパーコンピュータシステム (Oakleaf-FX) グループコース プロジェクト管理者用利用手引書」をご覧ください)。
【Case 6】SIM4014 エラーが出力されたpjsub: ERROR: SIM4014: specification of two-dimensional/three-dimensional shape is restricted when resource group `リソースグループ名' is given. For more information, see http://www.cc.u-tokyo.ac.jp/system/fx10/fx10_201405shapeRestrict.html
debug, short では形状指定ができません。詳細は「小規模ジョブに関するノードの形状指定とステップジョブの制限について」をご覧ください。
【Case 7】SIM4015 エラーが出力されたpjsub: ERROR: SIM4015: when number of required nodes is 72 or less, specification of two-dimensional/three-dimensional shape(指定形状) is restricted when resource group `リソースグループ名' is given. For more information, see http://www.cc.u-tokyo.ac.jp/system/fx10/fx10_201405shapeRestrict.html
regular(small)で要求ノード数が72以下の場合、形状指定ができません。詳細は「小規模ジョブに関するノードの形状指定とステップジョブの制限について」をご覧ください。
【Case 8】SIM4017 エラーが出力されたpjsub: ERROR: SIM4017: Any subjob is not accepted to Job `ステップジョブ代表ジョブID'(maximum number of subjob: 2). For more information, see http://www.cc.u-tokyo.ac.jp/system/fx10/fx10_201405shapeRestrict.html
debug では 2 段を超える段数のステップジョブの投入ができません。詳細は「小規模ジョブに関するノードの形状指定とステップジョブの制限について」をご覧ください。
SIMXXXXエラーが出力された場合は、利用支援ポータル内にある以下のマニュアルを参照してください。
・FX10 スーパーコンピューターシステム Oakleaf-FX / Oakbridge-FX 利用手引書
「センターコマンドのエラーメッセージ」
- ジョブの削除方法について教えてください。
-
ジョブの削除には、pjdel コマンドを使用します。詳細は、利用支援ポータル内にある以下のマニュアルを参照してください。
・FX10 スーパーコンピューターシステム Oakleaf-FX / Oakbridge-FX 利用手引書
「ジョブキャンセル(pjdel コマンド)」
・ジョブ運用ソフトウェア エンドユーザ向けガイド
- ジョブの実行状態等について確認する方法を教えてください。
-
ジョブの実行状態等の確認には、pjstat コマンドを使用します。詳細は、利用支援ポータル内にある以下のマニュアルを参照してください。
・FX10 スーパーコンピューターシステム Oakleaf-FX / Oakbridge-FX 利用手引書
「ジョブ状態表示(pjstat コマンド)」
・ジョブ運用ソフトウェア エンドユーザ向けガイド
- ジョブの実行が開始されません。
-
以下の点についてご確認ください。
1. 実行待ちジョブの要求する計算資源の確保を待っている場合があります。pjstat --nodeuse コマンドでシステム全体の使用状況が確認できます。
RSCGRP Used/Toatal debug ********----------------- 30%( 145/ 480) short ****************--------- 61%( 291/ 480) regular *********************---- 81%(3127/3840) interactive ************************* 100%( 50/ 50)
2. フェアシェア運用によるジョブスケジューリングを行っているために、他のジョブよりも優先順位が低くなっている場合があります。
3. 実行待ちジョブで指定されている計算時間が、サービス休止までの残り時間より大きい時間を指定している場合があります。サービス休止までの残り時間は pjstatコマンドで確認することができます。
4. 同時実行数の上限に達している場合があります。他にジョブを実行していない、また、同じグループの他の利用者がジョブを実行していないか確認してください。pjstat コマンドを使用することで確認できます。同時実行数などの確認には、pjstat コマンドを使用することで確認できます。
5. ジョブ実行時の計算ノード形状が指定されている場合には、利用者が指定したジョブ形状が確保されない場合にはジョブの実行が抑止されます。
6. 大規模 HPC チャレンジサービス実施中の場合、ログインノード、インタラクティブジョブサービスのみ行っています (debug、short、regular などのバッチジョブサービスは停止しています)。
- インタラクティブジョブを起動した時、コマンド入力待ちとならずに止まっていることが何度かあったのですが、これは同時実行可能件数を使い果たしたために待たされている状態なのですか?(別端末で pjstat で見ると状態は「RUNNING」でした)
- 同時実行件数オーバーで待たされている場合は「RUNNING」にはなりません。システムの障害の可能性がありますので、再発した場合は、相談受付(
)までご連絡ください。
- 4 ノードジョブを実行した場合、どの様にノードが割当てられるのでしょうか。1 ジョブで Tofu を専有するのでしょうか。
- 他のジョブ実行状況により異なりますが、原則、複数のジョブで Tofu を共有して割り当てられます。そのため、形状指定した場合と比較して、通信性能が低下することがあります。
グループ管理者機能について
- グループ管理者機能とは、どの様な機能でしょうか。
-
グループ管理者機能とは、グループ内利用者のトークン量の確認・制限や、ジョブ実行状況などを確認できる機能です。
グループ管理者機能の詳細は、「FX10 スーパーコンピューターシステム (Oakleaf-FX) グループコース プロジェクト管理者用利用手引書」をご覧ください。
グループ管理者機能で提供される主な機能 グループ管理者機能 ログインノード 利用支援ポータル グループ内利用者のトークンの確認 ○ ○ 利用可能なノード数、トークン量の変更 (設定) ○ ○ ジョブの実行履歴表示 ○ ×
- グループ管理者がグループ内利用者に対して何が制限できるのでしょうか。
- グループ管理者はグループ内の利用者に対して、利用可能な最大トークン量や使用できる最大ノード数を制限することができます。詳しくは、「FX10 スーパーコンピューターシステム (Oakleaf-FX) グループコース プロジェクト管理者用利用手引書」をご覧ください。
- グループ管理者機能はどこで利用 (操作) 可能ですか。
-
グループ管理者機能はグループ管理者で登録された方が利用できる機能です。また、グループ管理者機能は、ログインノード・利用支援ポータルで提供しています (ただし、一部機能についてはログインノードのみ、利用支援ポータルのみの機能提供となっています)。
なお、グループ管理者機能の詳細は、「FX10 スーパーコンピューターシステム (Oakleaf-FX) グループコース プロジェクト管理者用利用手引書」をご覧ください。
- グループ管理者がグループ内利用者が使用できる トークン量を制限したいのですが、制限可能でしょうか。
-
set_token コマンド、または利用支援ポータルで使用できる トークン量 (時間単位) を変更することができます。詳しくは、「FX10 スーパーコンピューターシステム (Oakleaf-FX) グループコース プロジェクト管理者用利用手引書」の set_token コマンドをご覧ください。
% set_token -g グループ (プロジェクトコード) -u 利用者番号 -l トークン量
ログインノードでの実行例 トークン量の変更
(以下の例では、z30000 (グループ管理者) が z30001 利用者のトークン量を 10 時間に制限する)
1.設定状況の確認[z30000@oakleaf-fx-1 ~]$ show_token Project User Limit(hours) Used(hours) Used% Pri-node Max-node -------------------------------------------------------------------------- gz00 - 207,360 219.2 0% 24 1,440 z30000 - 0.0 - - - z30001 - 0.0 - - -
2.設定を変更する[z30000@oakleaf-fx-1 ~]$ set_token -g gz00 -u z30001 -l 10 [INFO] ACC 0201 set_token command successful. 設定状況の確認 (Limit(hours) に "10" 時間が設定されたことを確認) [z30000@oakleaf-fx-1 ~]$ show_token Project User Limit(hours) Used(hours) Used% Pri-node Max-node -------------------------------------------------------------------------- gz00 - 207,360 219.2 0% 24 1,440 z30000 - 0.0 - - - z30001 10 0.0 - - -
利用支援ポータルのトークン設定変更画面
- グループ管理者がグループ内利用者の使用できる最大ノード数を制限したいのですが、制限可能でしょうか。
-
set_token コマンドで最大ノード数を変更することが出来ます。詳しくは、「FX10 スーパーコンピューターシステム (Oakleaf-FX) グループコース プロジェクト管理者用利用手引書」の set_token コマンドをご覧ください。
% set_token -g グループ (プロジェクトコード) -u 利用者番号 -n 最大ノード数
ログインノードでの実行例 ノード数の変更
(以下の例では、z30000 (グループ管理者) が z30001 利用者のノード数を 12 ノードに制限する)
1.設定状況の確認[z30000@oakleaf-fx-1 ~]$ show_token Project User Limit(hours) Used(hours) Used% Pri-node Max-node -------------------------------------------------------------------------- gz00 - 207,360 219.2 0% 24 1,440 z30000 - 0.0 - - - z30001 - 0.0 - - -
2.設定を変更する[z30000@oakleaf-fx-1 ~]$ set_token -g gz00 -u z30001 -n 12 [INFO] ACC 0201 set_token command successful. 設定状況の確認 (Max-node に "12" が設定されたことを確認) [z30000@oakleaf-fx-1 ~]$ show_token Project User Limit(hours) Used(hours) Used% Pri-node Max-node -------------------------------------------------------------------------- gz00 - 207,360 219.2 0% 24 1,440 z30000 - 0.0 - - - z30001 - 0.0 - - 12
利用支援ポータルのトークン設定変更画面
- グループ管理者がグループ内利用者のジョブ実行状況 (投入状況) を確認する方法はありますか。
-
pjstat -A コマンドで確認することができます。詳しくは、利用支援ポータル内にある以下のマニュアルを参照してください。
・FX10 スーパーコンピューターシステム Oakleaf-FX / Oakbridge-FX 利用手引書
実行例 z30000 (グループ管理者) が z30001 利用者のジョブ投入・実行状況を参照する
「ジョブ状態表示(pjstat コマンド)」
・ジョブ運用ソフトウェア エンドユーザ向けガイド
[z30000@oakleaf-fx-1 ~]$ pjstat 自分のジョブ投入状況が表示される (表示例ではジョブ投入なし) Oakleaf-FX scheduled stop time: 2012/06/29(Fri) 09:00:00 (Remain: 0days 16:21:45) No unfinished job found. [z30000@oakleaf-fx-1 ~]$ pjstat -A -A オプションを指定することでグループ内利用者の状況が表示される Oakleaf-FX scheduled stop time: 2012/06/29(Fri) 09:00:00 (Remain: 0days 16:21:21) JOB_ID JOB_NAME STATUS USER PROJECT RSCGROUP START_DATE ELAPSE TOKEN NODE:COORD 654321 a.sh QUEUED z30001 gz00 hort --/-- --:--:-- 00:00:00 (12.0) 12
- グループ管理者がグループ内利用者のジョブ実行履歴情報を確認する方法はありますか。
-
pjstat -H -A コマンドで確認することができます。詳しくは、利用支援ポータル内にある以下のマニュアルを参照してください。
・FX10 スーパーコンピューターシステム Oakleaf-FX / Oakbridge-FX 利用手引書
実行例 z30000 (グループ管理者) が z30001 利用者の実行履歴を確認
「ジョブ状態表示(pjstat コマンド)」
・ジョブ運用ソフトウェア エンドユーザ向けガイド
[z30000@oakleaf-fx-1 ~]$ pjstat -H Oakleaf-FX scheduled stop time: 2012/06/15(Fri) 09:00:00 (Remain: 6days 23:03:05) JOB_ID JOB_NAME STATUS PROJECT RSCGROUP START_DATE ELAPSE TOKEN NODE:COORD 267783 STDIN END gz00 interactive_n1 06/07 16:36:48 00:01:28 - 1 267840 STDIN END gz00 interactive_n1 06/07 17:28:59 00:00:02 - 1 pjstat -H コマンド実行することで、自分の実行履歴のみ表示される [z30000@oakleaf-fx-1 ~]$ pjstat -H -A Oakleaf-FX scheduled stop time: 2012/06/15(Fri) 09:00:00 (Remain: 6days 23:02:58) JOB_ID JOB_NAME STATUS USER PROJECT RSCGROUP START_DATE ELAPSE TOKEN NODE:COORD 267783 STDIN END z30000 gz00 interactive_n1 06/07 16:36:48 00:01:28 - 1 267840 STDIN END z30000 gz00 interactive_n1 06/07 17:28:59 00:00:02 - 1 268293 STDIN END z30001 gz00 interactive_n1 06/08 09:55:00 00:01:26 - 1 pjstat -H -A コマンド実行することで、自分の実行履歴以外にも、グループ利用者の情報が表示される
- グループ管理者がグループ内利用者にどの様な設定をおこなっているかなどの設定状況を確認する方法について教えてください。
- show_token コマンド、または利用支援ポータルで確認することができます。詳しくは、「FX10 スーパーコンピューターシステム (Oakleaf-FX) グループコース プロジェクト管理者用利用手引書」の show_token コマンドをご覧ください。
利用支援ポータル・鍵登録について
- 利用支援ポータルでは何が行えるのでしょうか。
- 利用支援ポータルでは、FX10 スーパーコンピュータシステムへログインする際に利用する公開鍵登録や、メーカ提供のマニュアル、コンパイラのバージョンアップ情報などが閲覧できます。また、グループ管理者機能の一部についても利用支援ポータルで実行できます。詳しくは、「FX10 スーパーコンピューターシステム (Oakleaf-FX) グループコース プロジェクト管理者用利用手引書」をご覧ください。
- 利用支援ポータルで操作を行ったが、正常に動作しない。
-
利用支援ポータルは、以下のブラウザで動作確認を行っています。それ以外のブラウザやバージョンでは動作しない可能性があります。動作確認済みブラウザでお試しいただくか、相談受付(
)まで、行った操作の詳細と、利用している環境 (OS、ブラウザ名称・バージョン)、出力されるエラーメッセージなどの詳細をお知らせください (お知らせ頂いた内容によっては、対応不能の場合もありますので、ご注意ください)。
※ JavaScript、Cookie を有効にしてお使いください。
動作確認済みブラウザ
・Internet Explorer バージョン 8 以上
・Safari バージョン 5 以上
・Firefox バージョン 9 以上
・Google Chrome バージョン 18 以上
- 利用支援ポータルを利用しようとしましたがエラーとなります。
- ポータル機能の言語サポートは、utf-8 のみとなっています。そのため、ログインノードにログイン (ssh) する際の環境変数で、他の日本語設定 (ja_JP.eucjp か japanese.euc か ja_JP.ujis) に変更されている場合、エラーとなる場合があります。設定を初期値 (ja_JP.utf8) にしてポータルログイン可能かご確認ください。
- 利用支援ポータルで、メーカ提供のマニュアルが閲覧可能とありますが、どの様なマニュアルが準備されているのでしょうか。また、英語のマニュアルもありますか。
-
利用支援ポータルで、以下のメーカ提供マニュアルを公開しています。また、利用手引書など適宜最新の情報に更新しております (マニュアルの更新日についても記載しています)ので、参考にしてください。
● Oakleaf-FX / Oakbridge-FX 利用手引書
Oakleaf-FX / Oakbridge-FX 利用手引書 (日本語)
グループコース管理者向け利用手引書 (日本語)
「京」とFX10をそれぞれ利用する際の留意事項 (日本語)
● チューニングマニュアル
FX10 チューニングガイド C/C++ 編 (日本語)
FX10 チューニングガイド Fortran 編 (日本語)
FX10 チューニングガイド MPI 編 (日本語)
● 製品マニュアル Technical Computing Suite
○ コンパイラ
■ Fortran
Fortran 使用手引書 (日本語、英語)
Fortran 文法書 (日本語、英語)
Fortran 翻訳時メッセージ説明書 (日本語、英語)
■ C/C++
C 言語使用手引書 (日本語、英語)
C++ 言語使用手引書 (日本語、英語)
C/C++ 最適化メッセージ説明書 (日本語、英語)
■ 実行時メッセージ説明書
Fortran/C/C++ 実行時メッセージ説明書 (日本語、英語)
○ 並列ライブラリ
■ MPI
MPI使用手引書 (日本語、英語)
■ XPFortran
XPFortran使用手引書 (日本語、英語)
○ プログラム開発支援ツール
■ 使用手引書
実行時情報出力機能使用手引書 (日本語、英語)
プログラミング支援ツール使用手引書 (日本語、英語)
プロファイラ使用手引書 (日本語、英語)
デバッガ使用手引書 (日本語、英語)
ランク配置最適化ツール使用手引書 (日本語、英語)
○ 数学ライブラリ
■ 利用ガイド
数学ライブラリ利用ガイド (日本語、英語)
数学ライブラリ追加機能一覧 (日本語)
■ SSL II
SSL II 使用手引書 (日本語、英語)
SSL II 拡張機能使用手引書 (日本語、英語)
SSL II 拡張機能使用手引書 II (日本語、英語)
SSL II スレッド並列機能使用手引書 (日本語、英語)
■ C-SSL II
C-SSL II 使用手引書 (日本語、英語)
C-SSL II スレッド並列機能使用手引書 (日本語、英語)
■ SSL II/MPI
SSL II/MPI 使用手引書 (日本語、英語)
■ BLAS/LAPACK/ScaLAPACK
BLAS LAPACK ScaLAPACK 使用手引書 (日本語、英語)
■ 高速 4 倍精度基本演算ライブラリ
高速 4 倍精度基本演算ライブラリ使用手引書 (日本語、英語)
■ ジョブ運用ソフトウェア
エンドユーザ向けガイド (日本語、英語)
- 利用支援ポータルで公開鍵登録を行おうとしましたが、ログインできません。また、以下のメッセージが出力されます。
"ログイン名とパスワードが一致しません" 利用登録のお知らせ(書面)の初期パスワード欄に示されている文字列の入力には注意事項がございます(欄外に赤色で記載)。この点をご確認のうえ、お試しくださいますようお願いいたします。
なお、パスワードが不明な場合はプログラム相談票に必要事項をご記入の上、相談受付()までご連絡ください。
- 利用していた PC を初期化してしまいました。利用支援ポータルで再度鍵登録を行いたいのですが、「公開鍵登録後、1 度システムにログインされたため、本機能は使用できません。」と表示され、鍵登録できなくなってしまいました。どの様にすればよいでしょうか。
-
以下の内容 (プログラム相談票に必要事項を) ご記入の上、相談受付(
)まで、ご連絡ください。
・利用者番号
・氏名、所属、連絡先
・鍵情報 (鍵登録内容) を紛失した (再登録が必要となった) 理由
- 複数の PC から login できるようにしたいのですが、どの様にすれば良いでしょうか。利用支援ポータルで複数鍵登録が行えるのでしょうか。
-
利用支援ポータルによる鍵登録が可能なのは、最初に SSH 接続 (login) に成功するまでとなっています。そのため、他のマシン用の鍵を追加したり、登録済みの鍵を変更する場合は FX10 スーパーコンピュータシステム (oakleaf-fx) に login し、
~/.ssh/authorized_keys
に書かれている公開鍵をエディタで直接編集する必要があります。公開鍵は、一行に一個の公開鍵を書きます。鍵の文字列は長いため、多くの場合は複数行にわたって表示されることになりますが、データ上は一個の鍵は一行でなくてはなりません。鍵の途中に改行を入れないようご注意下さい。
このファイルを削除したり、書かれている公開鍵を壊してしまうと login できなくなりますので、編集には十分ご注意ください。
- .ssh ディレクトリのパーミッションを変更してしまい、login できなくなりました。どの様にすれば良いでしょうか。
- プログラム相談票に必要事項をご記入の上、相談受付(
)まで、ご連絡ください。なお、当該ディレクトリ、ファイルについてはパーミッション、保存されている鍵の記載内容が不正になると login できなくなりますので、編集等には十分ご注意ください (事前にバックアップ等を取得し、他の端末から接続できることなどを確認の上、logout してください)。
その他
- FX10 スーパーコンピュータシステムを利用していますが、反応が遅いです。
- 反応が遅い、動作がおかしいと思われた場合には、お手数ですが、本センター相談受付(
)までご連絡下さい。ご連絡の際には、上記の状態となった日時やどの様な操作を行っていたか等の情報提供についてもあわせてお願い致します (プログラム相談票に必要事項をご記入の上、ご連絡ください)。
- FX10 スーパーコンピュータシステムを利用していますが、プログラムの実行 (時間) が遅い (長い) です。何が原因でしょうか。
-
上記のご質問 (内容) では対応 (調査) が非常に困難です。どの様な環境比較した結果なのかなどの詳細情報を提供してください (プログラム相談票に必要事項をご記入の上、ご連絡ください)。
・比較対象とした環境 (計算機のハードウェアスペック、OS・コンパイラを含めたソフトウェアスペック、バージョン情報などの詳細)
・ソースプログラムの提供ならびにコンパイル方法や実行環境の提供
・実行時間等の比較結果
・その他、調査に有用と思われる情報
- FX10 スーパーコンピュータシステムのエンディアンは何ですか。
- ログインノードはリトルエンディアンです。計算・インタラクティブノードは、ビックエンディアンです。ログインノードと計算・インタラクティブノードでは、異なるエンディアンとなっていますので、プログラムを実行する時などご注意ください。
- 詳細プロファイラを使用するとジョブの実行時間が長くなります。
-
詳細プロファイラを使用するとプロファイラ情報の収集処理時間が実行時間に含まれるため、実行時間が長くなります。ただし、詳細プロファイラ結果には、この収集処理時間は含まれません。
また、TLB (Translation Lookaside Buffer)ミスが発生しやすいプログラムに対して詳細プロファイラを使用した場合、詳細プロファイラが動的に確保するメモリの影響で、TLBミスが増加し、実行時間が長くなることがあります。詳細プロファイラ結果で TLBミス率が 0.005% を超える場合は、ラージページのサイズを変更(32MByte または 256MByte)して実行することで TLBミス率を下げることができます。
ラージページサイズの変更方法は、利用支援ポータル内にある以下のマニュアルを参照してください。
・FX10 スーパーコンピューターシステム Oakleaf-FX / Oakbridge-FX 利用手引書
「ラージページ・ジョブメモリ」
- FX10 スーパーコンピュータシステムの愛称(Oakleaf-FX)の意味は ?
- FX10 スーパーコンピュータシステム及びSR16000 システム(SMP)の愛称は設置場所に因んでおり、FX10 スーパーコンピュータシステム "Oakleaf-FX" は 2011 年 5 月に柏キャンパスに完成した第 2 総合研究棟に導入された最初のシステムです。なお、SR16000 システム(SMP)の愛称は "Yayoi" で、弥生地区に設置されたスーパーコンピューターシステムとなります。