東京大学情報基盤センター スーパーコンピューティング部門

Wisteria/BDEC-01 FAQ

利用申込について

Wisteria/BDEC-01 の利用申込を行いたいのですが、申込開始日等について教えてください。
計算リソースに余裕がある限り随時利用申込を受付けます。新規申込フォーム(通常利用(一般)から必要事項を入力してお申込ください。通常利用(一般)以外のご利用を希望される場合は各申込サイトよりお申込ください。
Wisteria/BDEC-01 の申込や利用に際して事前に確認 (注意) する点などはありますか。
Wisteria/BDEC-01 の申込方法や、利用方法、各種マニュアル等を用意しています。こちらで利用申込方法や、サービス内容について、ご確認ください (メーカー製の手引書やマニュアルについては、利用者限定になっています)。

Wisteria/BDEC-01 利用コースについて
Wisteria/BDEC-01 トークンの概要について
Wisteria/BDEC-01 利用負担金
Wisteria/BDEC-01 月数別利用負担金

(Wisteria/BDEC-01 利用方法等の概要を説明しています。
システム利用方法の詳細は、利用支援ポータル内にあります手引書、マニュアルを参照してください)

グループ内ディスク領域の制限値 (QUOTA) はどの様に設定されていますか。
グループ内ディスク領域には、グループに登録されているグループ内利用者個々のディレクトリ (以下の例の場合、/work/gz00/z3000*) と、グループ内利用者が共有して利用するディレクトリ (以下の例の場合、/work/gz00/share)を用意してあります。
それら全体に対してユーザおよびグループの制限値が設定されています。
申込が4セットの場合、ユーザ及びグループの制限値はいずれも8TBとなります。

グループ
トークン
(申込1セットあたり 8,640トークン)
グループ内ディスク領域
(申込1セットあたり 2TB割当)
/work/gz00/share
/work/gz00/z30000
/work/gz00/z30001
/work/gz00/z30002
グループ管理者とはどの様なこと (管理) を行うのでしょうか。
Wisteria/BDEC-01 では、バッチジョブ実行時に利用するトークンとノード数がグループ全体に割当てられますが、グループ管理者は利用者ごとに、これらの計算資源の上限値を設定・変更することができます。なお、トークン上限値、ノード数はグループに割当られた上限値を超過して変更することはできません。
グループ管理者機能
・グループ内利用者のトークン量の上限値変更 (初期値:グループ上限)
・グループ内利用者のノード数の上限値変更 (初期値:グループ上限)
利用者を自分のグループに追加することは可能ですか。この場合、新たにユーザIDが割り振られるのでしょうか。
グループに追加することは可能です。ただし、既に本センターの利用者をグループに追加する場合には、現在使用しているユーザIDに対してグループ追加登録処理を行いますので、新たにユーザIDを割り振ることはありません。
利用者を自分のグループに追加した場合、グループ内利用者に割り当てられる資源 (トークン、ディスク容量) はどの様に扱われますか。
新たにグループに追加登録された利用者に対しては、グループ内で利用可能なトークンの利用許可とグループ内利用者用領域に利用者ディレクトリが作成されます。
グループにユーザ「z40000」を追加した場合

グループ
トークン
(申込1セットあたり 8,640トークン)
z40000はトークンを利用可能
グループ内ディスク領域
(申込1セットあたり 2TB割当)
/work/gz00/share
/work/gz00/z30000
/work/gz00/z30001
/work/gz00/z30002
/work/gz00/z40000 ←z40000用ディレクトリを作成
グループからユーザ「z40000」を削除した場合
グループ
トークン
(申込1セットあたり 8,640トークン)
z40000はトークンを利用不可
グループ内ディスク領域
(申込1セットあたり 2TB割当)
/work/gz00/share
/work/gz00/z30000
/work/gz00/z30001
/work/gz00/z30002
/work/gz00/z40000 ←z40000用ディレクトリを削除
複数のグループに登録することは可能ですか。
可能です。追加されるグループ代表者の方が変更申込フォームから登録利用者変更申込を行ってください。
グループの利用者でしたが、登録していたグループの利用が取消されます。引き続き利用したいのですが、どの様にすれば良いでしょうか。
現在登録しているグループの利用期限までに、新たに利用申込をお願いいたします。利用期限終了後に申し込まれた場合、ユーザID並びに利用していたファイルの引き継ぎは行えませんのでご注意ください。
利用者は随時追加が可能でしょうか。
各年度の利用申込期限内であれば可能です。変更申込フォームから必要事項を入力してお申込ください。
登録する利用者数の上限はありますか。
登録する利用者数に制限はありません。ただし、利用登録者数とは関係なく、グループに割当てられるトークンは一定ですので、登録された利用者全員で使用する (トークンを消費する) ことになります。
申込セット数と最大ノード数との記載があります。これらの関係について教えてください。
Wisteria/BDEC-01 では、申込セット数に関係なく最大ノード数まで利用するとができます。
システム上に保存可能なファイル、ディレクトリ総数に上限はありますか。
Wisteria/BDEC-01 では、割当ディスク容量 1TB につき 50万個 までファイルおよびディレクトリを保存可能です。

▲ Wisteria/BDEC-01 FAQ TOPへ

トークン

トークンについて教えてください。
トークンに関する説明やFAQを掲載している「トークンについて」のページをご覧ください。

▲ Wisteria/BDEC-01 FAQ TOPへ

システム全般、サービス内容

教育利用とはどのような利用方法でしょうか。
東京大学情報基盤センター(以下、センター)では、大学院や学部の授業において、演習用としてスーパーコンピューター資源を提供しています。
気候・流体解析・構造解析・分子科学・ナノテクノロジー・航空宇宙など、多方面の研究分野で養われた手法を用いてスーパーコンピューターを演習教材として使用する動きがあり、既に学部の専門課程及び大学院の授業では、構造解析・地球科学・流体関係の演習用としてスーパーコンピューターが使われています。
教育現場でのスーパーコンピューターの利用は、人材育成や利用の拡大に繋げられると期待できることから、センターでは、大学、高等専門学校教員が担当する大学院、大学学部、高等専門学校における講義・演習(集中講義を含む)を対象とし、申込を随時受け付けています。
「教育利用」は、学内の利用に限定せず、東京大学以外からの利用申込も受け付けています。詳細は、「教育利用」をご覧ください。

提供資源
Wisteria-O : 1 ジョブあたりの最大実行時間 15 分、最大 ノード数 12 ノード (576 コア)
Wisteria-A : 1 ジョブあたりの最大実行時間 15 分、最大 ノード数 2 ノード (GPU 16基)
ログインシェルは変更可能でしょうか。
chsh コマンドにて変更可能です。標準では、ログインシェルを bash に設定しています。
他グループ(プロジェクト)のユーザが自分のファイルを参照出来るようにする方法はありますか。
初期状態では、/work/グループ名 の保護モードは2750(rwxr-s---)となっているため、このディレクトリ以下のファイルについて他グループ(プロジェクト)のユーザによる参照はできません。
また、このディレクトリの所有者はシステム管理者となっているため、当該グループ内ユーザによるアクセス許可設定の変更も出来ません。
しかし、グループ(プロジェクト)代表者からのご依頼をいただければ、このディレクトリの所有者をグループ(プロジェクト)代表者に変更いたします。
その後、下記の操作にて所属グループのディレクトリの属性をご変更下さい。
その際、ディレクトリの保護モードをchmodコマンドにより変更する方法(例:chmod o+rx やchmod 755)も可能ですが、それでは許可対象が広過ぎることになる場合があります。
許可の範囲を厳密に設定するにはファイルACL設定用のsetfaclコマンドをお使いください。
  1. グループ(プロジェクト)代表者が以下の操作を行なって下さい。
  2. 特定のユーザのみを対象とする場合は
    cd /work/グループ名
    setfacl -n -m u:ユーザ名:rx .
    特定の別グループ全員に許可を与える場合には
    cd /work/グループ名
    setfacl -n -m g:別グループの名前:rx .
  3. グループ内ユーザの操作
  4. /work/グループ名 より下の階層の各ユーザのディレクトリやファイルについては、当該ファイルの所有者である利用者が
    setfacl -n -m u:ユーザ名:rx ファイル名
    あるいは
    setfacl -n -m g:別グループの名前:rx ファイル名
    により許可の設定を行なって下さい。

    ファイル名の指定にはワイルドカード(*等)も指定可能です。また
    setfacl -R -n -m u:ユーザ名:rx ディレクトリ名
    のようにすることで指定したディレクトリ下のファイル全てが対象となります。

    ファイルACLの状態は
    getfacl ファイル名(ディレクトリ名)
    にてご確認頂けます。

▲ Wisteria/BDEC-01 FAQ TOPへ

コンパイラ

コンパイラのバージョンアップ情報について確認する方法はありますか。
利用支援ポータルでコンパイラのバージョンアップ情報を記載していますのでご確認ください。
デバッガ・プロファイラなどはありますか。
Intel VTune Amplifier XE, Arm DDT 等を用意しています。詳細は利用支援ポータル(- ドキュメント閲覧)にある「Wisteria/BDEC-01 システム利用手引書」等をご覧ください。

▲ Wisteria/BDEC-01 FAQ TOPへ

ライブラリ

ライブラリ (xxxx) を利用したいのですが、利用方法について教えてください。
利用支援ポータル(- ドキュメント閲覧)にある「Wisteria/BDEC-01 システム利用手引書」等をご覧ください。

▲ Wisteria/BDEC-01 FAQ TOPへ

アプリケーション

提供されているアプリケーション (xxxx) を利用したいのですが、利用方法について教えてください。
利用支援ポータル(- ドキュメント閲覧)にある「Wisteria/BDEC-01 システム利用手引書」等をご覧ください。
個別に購入したソフトウェアを使用することはできますか。
利用者ディレクトリにインストールして使用する場合には、ライセンス等をご確認の上、ご使用頂いても問題ありません。

▲ Wisteria/BDEC-01 FAQ TOPへ

ジョブ管理システム

キュー(リソースグループ/ジョブクラス)にはどの様な種類がありますか。
「キュー(リソースグループ/ジョブクラス)」を参照してください。
投入できるキュー(リソースグループ/ジョブクラス)を確認するコマンドはありますか。
pjstat --rsc コマンドで確認することができます。pjstatコマンドについては、利用支援ポータル内にある「Wisteria/BDEC-01 システム利用手引書」(- 5.8. ジョブ状態表示)に記載があります。
ジョブの最大投入数、最大同時実行本数について教えてください。
ご利用になられているノード群(Odyssey, Aquarius) により異なりますので、下記の表でご確認ください。
・Wisteria-O (Odyssey)
ユーザ単位 グループ単位
最大同時実行本数 制限なし 申込セット数が 2セットまでの場合は 4本
4セットまでの場合は 8本
8セットまでの場合は 16本
以降8セット単位で2本づつ追加される
※後掲の「申込セット数毎のジョブ最大同時実行本数」も
ご参照ください。
最大投入数 制限なし 最大同時実行本数 × 8
最大同時利用可能
ノード数
2304
最大ノード数
(ジョブ単位)
2304
※ 最小セットの場合、申込セット数は 1 となります。

申込セット数毎のジョブ最大同時実行本数(33セット以降は省略)

基本セット 1~2 3~4 5~8 9~15 16~23 24~31 32
最大同時実行本数 4 8 16 16 18 20 22

・Wisteria-A (Aquarius)
ユーザ単位 グループ単位
最大同時実行本数 制限なし 申込セット数が 12セットまでの場合は 2本
24セットまでの場合は 4本
以降12セット単位で1本づつ追加し、上限は10本とする
申込セット数が 24セットまでの場合は 4本
以降12セット単位で1本づつ追加し、上限は10本とする

申込セット数が 24セットまでの場合は 8本
以降12セット単位で2本づつ追加し、上限は20本とする

※後掲の「申込セット数毎のジョブ最大同時実行本数」も
ご参照ください。
最大投入数 制限なし 最大同時実行本数 × 2
最大同時利用可能
GPU数
64
最大GPU数
(ジョブ単位)
64
※ 最小セットの場合、申込セット数は 1 となります。

最大同時実行本数および最大投入数の制限緩和を実施しました。(2022.03.15)
申込セット数が12セット以下の場合について最大同時実行本数および最大投入数の制限緩和を実施しました。(2021.12.24)

申込セット数毎のジョブ最大同時実行本数

基本セット 1~24 25~35 36~47 48~59 60~71 72~83 84~95 96~
最大同時実行本数 8 8 10 12 14 16 18 20

以下のコマンドで最大同時実行本数、最大投入数および最大同時利用可能ノード数を確認できます。

$ pjstat --limit
SYSTEM: Odyssey
PROJECT     ACCEPT       RUN  BULK_ACCEPT  BULK_RUN      NODE
gXX0        0/ 128    0/  16         0/ 8    0/  16   0/ 2304
gXX1        0/  32    0/   4         0/ 8    0/   4   0/ 2304

SYSTEM: Aquarius
PROJECT     ACCEPT       RUN  BULK_ACCEPT  BULK_RUN     GPU
gXX0         0/  4    0/   2         0/ -    0/   -   0/ 64
gXX1         0/  4    0/   2         0/ -    0/   -   0/ 64

バッチジョブ、インタラクティブジョブの起動方法について教えてください。
バッチジョブの投入は pjsub コマンドで行います。詳細は、利用支援ポータル内にある「Wisteria/BDEC-01 システム利用手引書」(- 5.4. バッチジョブ実行, 5.5. インタラクティブジョブ実行)を参照してください。
ジョブの削除方法について教えてください。
ジョブの削除には pjdel コマンドを使用します。詳細は、利用支援ポータル内にある「Wisteria/BDEC-01 システム利用手引書」(- 5.9. ジョブキャンセル)を参照してください。
ジョブの実行状態等について確認する方法を教えてください。
ジョブの実行状態等の確認には、pjstat コマンドを使用します。詳細は、利用支援ポータル内にある「Wisteria/BDEC-01 システム利用手引書」(- 5.8. ジョブ状態表示)を参照してください。
ジョブの実行が開始されません。
以下の点についてご確認ください。

1. 実行待ちジョブの要求する計算資源の確保を待っている場合があります。pjstat --nodeuse コマンドでシステム全体の使用状況が確認できます。

$ pjstat --nodeuse
SYSTEM: Odyssey
RSCGRP                                                      Ratio Used/Total
debug-o/interactive-o             -------------------------    0%     0/ 768
short-o                           -------------------------    0%     0/ 384
regular-o                         *******************------   76%  4096/5376
priority-o                        ******-------------------   25%   288/1152

SYSTEM: Aquarius
RSCGRP                                                       Ratio Used/Total
debug-a/interactive-a             ************-------------   50%     1/  2
short-a                           ******-------------------   25%     1/  4
regular-a                         ********************-----   80%    20/ 26

SYSTEM: Prepost
RSCGRP                                                  Ratio Used/Total(Node)
prepost                       -------------------------    0%     0/   9

It is necessary to specify --gpuuse option in order to show the information of resource groups occupied GPU.

2. FIFO運用によるジョブスケジューリングを行っているために、先に投入された他のジョブの終了を待っている場合があります。

3. 実行待ちジョブで指定されている計算時間が、サービス休止までの残り時間より大きい時間を指定している場合があります。サービス休止までの残り時間は pjstatコマンドで確認することができます。

4. 同時実行数の上限に達している場合があります。他にジョブを実行していない、また、同じグループの他の利用者がジョブを実行していないか確認してください。pjstat --limit コマンドによりグループ内で実行中のジョブ数および同時実行数の上限を確認できます。

5. システム障害が発生している可能性があります。システム利用相談・質問受付のページよりお問い合わせください。

▲ Wisteria/BDEC-01 FAQ TOPへ

利用支援ポータル・鍵登録について

利用支援ポータルでは何が行えるのでしょうか。
利用支援ポータルでは、Wisteria/BDEC-01 へログインする際に利用する公開鍵登録や、利用手引書、メーカ提供のマニュアル、コンパイラのバージョンアップ情報などが閲覧できます。また、グループ管理者機能の一部についても利用支援ポータルで実行できます。詳しくは、「Wisteria/BDEC-01 グループコース プロジェクト管理者用利用手引書」をご覧ください。
利用支援ポータルで公開鍵登録を行おうとしましたが、ログインできません(認証に失敗します)。
利用登録のお知らせを書面で受領した方は初期パスワード欄外に赤色で記載されている注意事項をご確認のうえ、お試しくださいますようお願いいたします。利用登録のお知らせをメールにて受領した方はメール本文内のURLよりパスワードの再設定が可能です。再設定後に再度お試しください。
上記で解決しない場合には、受付(受付のメールアドレス)までご連絡ください。
.ssh ディレクトリのパーミッションを変更してしまい、login できなくなりました。どの様にすれば良いでしょうか。
システム利用相談・質問受付のページに必要事項をご記入の上、ご連絡ください。なお、当該ディレクトリ、ファイルについてはパーミッション、保存されている鍵の記載内容が不正になると login できなくなりますので、編集等には十分ご注意ください (事前にバックアップ等を取得し、他の端末から接続できることなどを確認の上、logout してください)。

▲ Wisteria/BDEC-01 FAQ TOPへ