HOME > システム > HA8000クラスタシステム > AVS/Express PCEの使用方法
AVS/Express PCEの使用方法
HA8000クラスタシステム向け並列処理対応可視化システムAVS/Express PCEのサービスを開始しました。 以下にAVS/Express PCEの起動方法を紹介します。
ログインの前に
AVS/Express PCEを使用するためには、端末に「Xサーバー」(Windowsシステムで使用できるフリーソフトウェア としては Cygwin/XやXmingなどがあります。)と呼ばれるソフトウェアがインストールされており、 動作している必要があります。 また、ログインする際はSSH対応のターミナルソフトウェアにおいて、 下記の例に示すようにX11 forwarding を有効にしてください。
UNIXシステムを使用しているときは、-X オプションを指定します。
$ ssh -X z00000@ha8000-3.cc.u-tokyo.ac.jp
WindowsシステムでPuTTYを使用しているとき
SSH X11フォワーディングオプション(カテゴリ:接続→SSH→X11)の設定項目のうち、「X11フォワーディングを有効にする」にチェックを入れてからログインします。
初めて使用するときは
1.ログインノードでパスフレーズ無しのSSH鍵を作ってください。
$ ssh-keygen
2.作ったSSH鍵を共有させます。
$ cat $HOME/.ssh/id_rsa.pub >> $HOME/.ssh/authorized_keys
3.計算ノード(y045~y048)のホスト鍵を取得します。
下記のようなジョブスクリプトを作り、qsubで実行してください。
#!/bin/csh
#@$-q avs
ssh-keyscan -t rsa y045
ssh-keyscan -t rsa y046
ssh-keyscan -t rsa y047
ssh-keyscan -t rsa y048
4.取得したホスト鍵を、$HOME/.ssh/knownhostsに追加してください。
ホスト鍵は 3.のジョブ実行結果ファイル(ジョブスクリプト名.oXXXXXX)に出力されます。
起動方法
1.AVS/Express PCEを起動する
以下の手順で起動します。並列処理しない場合は、並列処理しない場合の起動方法をご覧ください。
$ /opt/itc/avs/pce_scripts/pce_start.sh 4 ←並列数(2~64)
ターミナル画面には以下のような表示があり、AVS/Express PCE が起動し、並列ジョブ(各並列ノード)と通信が確立するまで、待ち状態になります。
Parallel num = 4
Request 749226.batch1 submitted to queue: avs.
$
AVS/Express Developer Edition
Version: 7.3 fcs linux_64_el4
Project: /opt/itc/avs/xp_pce73/express_pce73/avs_disp
リターンキーを入力するとプロンプトが戻るので、qstatコマンドでジョブのSTATEが「RUNNING」になり、画面上に、[Default user_area] と [Select File] ボタンがあるウィンドウが表示されるとAVS/ExpressPCEが操作できる環境となります。 「QUEUED」のときは、他に誰かが使用しているか、何らかの都合でavsキューが停止していますので使用可能となるまでお待ちください。
$ qstat
NQS schedule stop time : 2011/09/23 (Fri) 8:55:00 (Remain: 431h 23m 37s)
REQUEST NAME OWNER QUEUE PRI NODE E-TIME MEM STATE
123.batch1 run_pce z00000 avs 63 4 7200s 112GB RUNNING
一回に同時に利用できるユーザーは1名です。また、avsキューの制限時間は120分で、これが一回の利用時間の上限となります。
起動シェルの引数には、2~64の並列数を指定する必要があり、起動可能なプロセスは1ノードあたり16、使用可能ノード数は4ノードまでとなっています。したがって並列数は最大64となりますのでご注意ください。
2.AVS/Express PCEを使用する
AVS/ExpressPCEの操作、使用方法についてはオンラインマニュアルをご覧ください。
http://ha8000.cc.u-tokyo.ac.jp/
なお、参照にあたっては、ユーザIDとパスワード(鍵登録に使用するもの)が必要です。
- AVS/Express 標準版
- チュートリアルガイド
- ユーザーズガイド
- モジュールリファレンス第1部
- モジュールリファレンス第2部
- デベロッパーズガイド第1部
- デベロッパーズガイド第2部
- AVS/ExpressPCE 並列版
- PCEユーザーズガイド
- PCEモジュールリファレンス
- PCE操作方法とネットワークサンプル
- PCEの紹介
3.AVS/Express PCEを終了する
AVS/ExpressPCEのウィンドウの「Exit」ボタンを押して終了します。
(AVS/ExpressPSTの終了方法と異なるのでご注意ください)
また、qstat コマンドでジョブが終了したことをご確認願います。ジョブが終了するまでは次のジョブが実行できないため、他の利用者に迷惑をかけることとなりますのでご注意ください。
作業終了後は、必ずAVS/ExpressPCEを終了(Exit)してください。
$ qstat
並列処理しない場合の起動方法
並列ライブラリ(PARAライブラリ)を使用しないときは、次のコマンドのみで起動できます。
$ /opt/itc/avs/pce_scripts/run_express.sh
エラーについて
連続して作業していると、前のジョブのソケットがクローズできておらず、次のジョブの通信ができない場合があります。
ジョブ起動時に、下記メッセージが出てすぐに終了してしまう場合、少し時間を置いてから起動してください。また、ジョブが実行中(RUNNING)の場合、次のジョブが起動できないため、qdel コマンドで削除してください。
can not create server socket.
注意事項
ここに掲載した手順以外の方法でAVS/ExpressPCEを起動しないでください。正常に動作しないばかりか、他の利用者に迷惑をかけることになりますので、 本手順以外で起動したプロセスを発見した場合は、センターで強制終了する場合がありますのでご了承ください。