東京大学情報基盤センター スーパーコンピューティング部門

Reedbush-H 大規模 HPC チャレンジ FAQ

ご利用に関して

「Reedbush-H 大規模 HPC チャレンジ」について教えてください。
「Reedbush-H 大規模 HPC チャレンジ」とは、Reedbush-H スーパーコンピュータシステムの全計算ノード (120 ノード(GPU 240基)) を専有利用することができる公募型プロジェクトです。 詳しくは、「Reedbush-H 大規模 HPC チャレンジ」をご覧ください。
「Reedbush-H 大規模 HPC チャレンジ」を利用するにあたり必要な手続き等がありますか。
「Reedbush-H 大規模 HPC チャレンジ」を利用するには、年複数回行われている課題募集に応募の上、課題採択される必要があります。詳しくは、「Reedbush-H 大規模 HPC チャレンジ」をご覧ください。
「Reedbush-H 大規模 HPC チャレンジ」を利用するための条件は何がありますか。
「最大120ノード」を使用する大規模計算を実施する研究に限定します。また、申込者及び研究グループのメンバーは、国内外の並列計算機を利用した大規模計算の実績があることを前提としていますが、HPC に関連した幅広い分野の研究を対象としています。ただし、ソフトウェアベンダ開発ソフトウェアを利用するなどの利用ではなく、自作プログラム、オープンソースプログラムを利用した課題に限定いたします。 詳細は、「Reedbush-H 大規模 HPC チャレンジ」の研究対象をご覧ください。
「Reedbush-H 大規模 HPC チャレンジ」が利用できるメンバーについて何か制限がありますか。
申込者は「国内の大学、公共機関に所属する研究者、および民間企業に所属する者」とします。また、研究グループのメンバー又は申込者が企業の方の場合は、以下の書類のいずれかを提出していただく必要があります。 詳細は、「大規模 HPC チャレンジ」の利用資格をご覧ください。

研究グループのメンバーに企業の方が含まれる場合

以下の書類のいずれかを提出していただく必要があります。
  • 「共同研究契約書の写し」
  • 「適切に監督を行うことを記した誓約書及び請負契約書の写し」
  • 「利用規程にある利用目的を遵守することを記した誓約書」

研究グループのメンバーに外国人利用者が含まれる場合

輸出貿易関連法規に違反しないことを確認してください。
詳しくは、「外国人及び海外在住者のスパコン利用について」をご覧ください。
「大規模 HPC チャレンジ」の利用が許可されましたが、課題応募時の利用者以外の利用者追加は認められますか。また、ディスク量等の追加は認められますか。その場合の申込み方法等について教えてください。
問い合わせ窓口(受付のメールアドレス)までメールでお問い合わせください。
「大規模 HPC チャレンジ」の課題提出時に利用環境を含めた課題審査を行っています。そのため、利用者の追加やディスク量の追加等については、再度課題審査による再審査が行われます。再審査の結果、追加等が認められる場合もありますが、再審査には時間を要することから、利用開始までに間に合わない場合もあります。応募には、Reedbush-H スーパーコンピュータシステムの利用者およびディスク量等の必要事項を精査の上、ご応募ください。
「大規模 HPC チャレンジ」が利用できるまでの流れを教えてください。
「大規模 HPC チャレンジ」は、利用者の皆様から申し込まれた課題を審査委員会により審査を行い、採択課題を選考します。課題が採択された場合は、申込書に記載されている利用希望時期の中からセンターが設定した利用日時と、利用申込書をメールに添付してご連絡いたしますので、必要事項をご記入の上、東京大学 情報システム部 情報戦略課 研究支援チームへご提出いただきます。ご利用の約 1 ヶ月前に、利用期間等が記載された「利用登録のお知らせ」が送付されます。ご利用後は、実績報告書の提出、広報誌への成果報告記事の執筆、査読付国際会議への投稿 (速報) などを行っていただきます。センターの主催、共催するセミナー、ワークショップ等でご発表いただく場合があります。
「大規模 HPC チャレンジ」ご利用の流れ(概要)
既にReedbush-H を利用していますが、「大規模 HPC チャレンジ」利用のための新しいユーザIDが発行されるのでしょうか。
「大規模 HPC チャレンジ」に採択された利用者が既に本システムの利用者である場合には、新たなユーザIDは発行されずに、「大規模 HPC チャレンジ」利用のためのトークンが追加されるだけです (「大規模 HPC チャレンジ」グループメンバ全員で利用可能なトークンが追加されます)。また、本システムの利用者でない場合 (メンバー) には、「大規模 HPC チャレンジ」利用期間のみ利用可能なユーザIDと、トークンが付与されます。
「大規模 HPC チャレンジ」利用で、新たなディレクトリ (ファイル容量等) は追加されるのでしょうか。
「大規模 HPC チャレンジ」利用のためのグループとして利用登録されます。そのため、「大規模 HPC チャレンジ」利用期間中だけ利用可能なディレクトリが追加されます。ただし、利用期間終了後には追加されたディレクトリ・ファイル等、全て削除されます。
「大規模 HPC チャレンジ」の利用が許可された後の利用方法について教えてください。
大規模HPCチャレンジご利用の約 1 ヶ月前に送付する「利用登録のお知らせ」にて、大規模HPCチャレンジ用のプロジェクトコードをお知らせします。
大規模HPCチャレンジ用にトークン 7,200ノード時間、及び、ディスク容量(グループあたり /lustre に 16 TB)が割り当てられます。 トークンは大規模HPCチャレンジ当日までに debug 等を行うために利用できるものです。
大規模HPCチャレンジの利用許可期間は、大規模HPCチャレンジ実施日を含む月の1日から翌月の大規模HPCチャレンジ前日までです。 利用許可期間が終了した時点で、大規模HPCチャレンジ用のグループが利用取消され、割り当てられたトークン及びディスク内のファイルが削除されますのでご注意ください。
ログインノードは大規模HPCチャレンジ当日も利用可能ですので、通常どおり、ログインしてジョブを投入してください。 なお、大規模HPCチャレンジ実施中は、トークンの消費はありません。
成果報告書等を英文で提出 (記載) しても良いでしょうか。また、その場合に記載する謝辞の例などはありますか。
英文でも差し支えありません。例については、「論文等で研究成果を報告する場合の英文表記について」をご覧ください。

▲ 大規模 HPC チャレンジ FAQ TOPへ

トークンに関して

「Reedbush-H 大規模 HPC チャレンジ」利用で使用できるトークン量はどの程度が割当てられるのでしょうか。
「大規模 HPC チャレンジ」利用期間中に利用できるトークン量は 7,200 ノード時間になります (4 ノード相当)。この割当てられたトークンは、「大規模 HPC チャレンジ」当日までに debug 等を行うために利用できるものです。
最初に割当られたトークンが 7,200 ノード時間である場合、「大規模 HPC チャレンジ」当日 には、トークンが不足する可能性がありますが。
「大規模 HPC チャレンジ」当日に使用するキューはトークン対象外となっています。そのため、バッチジョブを実行しても割当てられたトークンを使用せず、バッチジョブ実行が可能です。
「大規模 HPC チャレンジ」利用で利用できるトークンについて何か制限等はありますか。
「大規模 HPC チャレンジ」利用で利用できるトークンは特段の制限はありません。そのため、利用できるキューについても、一般の利用者と変更はありません。
「大規模 HPC チャレンジ」利用で割当てられたトークンを全て使用してしまいました。トークンの追加は可能でしょうか。
「大規模 HPC チャレンジ」利用で割当てられたトークン以上のトークンの追加は認められません。
「大規模 HPC チャレンジ」用のユーザIDまたは、トークンの利用期限について教えてください。また、ファイルをバックアップするのはいつまでに行えばよいですか。
ご利用の翌月に実施される「大規模 HPC チャレンジ」前日までが利用期限となります。

「大規模 HPC チャレンジ」用にユーザIDを取得した場合

上記の通り、ご利用の翌月に実施される「大規模 HPC チャレンジ」前日までが利用期限となります。そのため、この期間中 (利用を許可された期間中) にファイルのバックアップ、移行等を実施してください (利用期限が終了した時点で、ユーザID・ファイル等は削除されます。センターではファイルのバックアップは取得しておりませんので、必ず利用期間中にファイルのバックアップ・移行等を終了してください)。

「大規模 HPC チャレンジ」用のトークンが追加されている場合

上記の通り、ご利用の翌月に実施される「大規模 HPC チャレンジ」前日までがトークンの利用期限となります (利用期間終了後には、「大規模 HPC チャレンジ」で追加されたトークンは利用できなくなりますのでご注意ください)。また、「大規模 HPC チャレンジ」でディスク量の上限値が追加されている場合には、利用期間終了後にはファイル容量が利用登録時の設定値に修正 (元の値に変更) されます。ディスク容量の上限値管理には十分注意をお願いいたします。

▲ 大規模 HPC チャレンジ FAQ TOPへ

ジョブ投入・管理について

「Reedbush-H 大規模 HPC チャレンジ」当日は、ログインノードの使用は可能ですか。
可能です。
通常どおり、ログインノードにログインして、ジョブを投入してください。
「Reedbush-H 大規模 HPC チャレンジ」で利用できるプロジェクトコード、キュー名 (指定方法) などについて教えてください。
「大規模 HPC チャレンジ」で利用できるプロジェクトコード、キュー名などの必要事項は「利用登録のお知らせ」に記載されますのでそちらをご覧ください。
指定例は以下となります。詳細は利用支援ポータル(-ドキュメント閲覧)の利用手引書をご覧ください。
[指定例]
 #!/bin/sh
 #PBS -q h-challenge                                  キューの指定
 #PBS -l select=120:ncpus=36:mpiprocs=36:ompthreads=1 ノード数等の指定
 #PBS -W group_list=gx10                              プロジェクトコードの指定
 #PBS -l walltime=5:00:00                             経過時間の指定
 #PBS -N job1                                         ジョブ名の指定

 mpirun ./a.out                                       プログラムの実行
実行されているジョブの確認方法について教えてください。
rbstat コマンドで確認できます。
「Reedbush-H 大規模 HPC チャレンジ」で同時投入可能なバッチジョブ数について教えてください。
同時投入可能なバッチジョブの最大数は、グループごとに 240 本です。
「Reedbush-H 大規模 HPC チャレンジ」で同時実行可能なバッチジョブ数について教えてください。
同時実行可能なバッチジョブの最大数は、グループごとに 120 本です。
「大規模 HPC チャレンジ」のスケジューリング方式について教えてください。
FIFO による実行です。
「大規模 HPC チャレンジ」で登録されている利用者の使用トークン量について確認する方法はありますか。
自分が使用したトークン量は、show_token コマンドで確認することができます。また、グループ管理者は、グループ内利用者のトークン量を確認することができます。
ジョブの実行が開始されません。

同じグループの他の利用者がジョブを実行している可能性があります。rbstat コマンドで他の利用者ジョブが実行されていないことを確認してください。

「大規模 HPC チャレンジ」実施中にインタラクティブジョブ実行は可能でしょうか。debug キューの利用についても可能でしょうか。
「大規模 HPC チャレンジ」実施中は、計算ノード全てを利用するため h-debug、h-short、h-interactive、h-regular などのキューは全て利用できなくなります。

▲ 大規模 HPC チャレンジ FAQ TOPへ

センターへの連絡について

「Reedbush-H 大規模 HPC チャレンジ」利用中にシステム障害が疑われる現象があります。問い合わせをしたいのですが。
「Reedbush 利用登録のお知らせ」に記載の当日連絡用メールアドレスまでご連絡ください。
※以下でご紹介しているシステム利用相談・質問受付のページは使用しないでください。とくに夜間の対応が行われません。
「Reedbush-H 大規模 HPC チャレンジ」に関連した、プログラム相談を行いたいのですが。
システム利用相談・質問受付のページよりお問い合わせください。ただし内容によっては、「大規模 HPC チャレンジ」実施期間中に回答できない場合がありますので、ご了承ください。

▲ 大規模 HPC チャレンジ FAQ TOPへ