東京大学情報基盤センター スーパーコンピューティング部門

Reedbush-H スーパーコンピュータシステム
「大規模 HPC チャレンジ」採択課題

2017年度 採択課題

このたびは、お申し込みをいただきどうもありがとうございました。以下の基準による厳正な審査のうえ、課題採択をさせていただきました(順不同)。

  • 自作コード、またはオープンソースプログラムによる研究であること。
  • 計算結果が科学的に有用、あるいは社会的なインパクトがあると考えられること。
  • 本センターの運用、ユーザーにとって有用な情報を提供すること。
  • 120 ノードの利用を目標としていること。
  • 計画に実現性があり、短時間で効果を示すことが可能であること (一回の利用期間は最大 24 時間)。

第1回採択課題

課題名 ChainerMN を用いた深層学習の性能評価
代表者名(所属) 塙 敏博(東京大学 情報基盤センター)
GPU を用いた深層学習(Deep Learning)の研究が盛んに行われており、様々なフレームワークが開発されている。Preferred Networks 社が中心となって開発している Chainer は、Python スクリプトで実装されており、define-by-run モデルによって簡便な記述で自由度の高いネットワークを記述することができる。さらに ChainerMN(Multi Node)が Chainer の追加パッケージとして開発され、データ並列に学習を行うことによって学習時間を短縮することが可能である。
本申請では、Reedbush-H 上で ImageNet の画像分類を学習させることにより、ChainerMN による深層学習の性能を評価する。特に Reedbush-H が備えるファイルキャッシュシステムである IME や、InfiniBand EDR スイッチが備える高速な集団通信などの優れた機能を最大限に活かすことを目的とする。

課題名 Reedbush-H における GPU のばらつきに関する研究
代表者名(所属) 三輪 忍(電気通信大学 大学院情報理工学研究科)
申請者は,JST CREST のプロジェクト「ポストペタスケールシステムのための電力マネージメントフレームワーク」(代表者:近藤正章・東京大学准教授)の主たる共同研究者として,次世代のスーパーコンピュータの電力管理手法の研究を行っている.上記プロジェクトにて,同一ロット間の電力ばらつきが CPU には存在しており,電力キャッピング時には上記ばらつきが CPU 間の性能ばらつきに転嫁されることが明らかになっている.上記ばらつきは製造ばらつきやマシン・ルーム内の温度分布のばらつき等の理由によって発生すると考えられており,同様の問題は GPU にも存在すると我々は考えている.しかし,GPU において電力ばらつき,あるいは,電力キャッピング時の性能ばらつきを確認したとの報告はまだない.GPU の電力管理手法を検討するためには GPU のばらつきの調査が必要であり,本研究課題では,その第一歩として,Reedbush-H が有する 240 台の Tesla P100 のばらつきを定量的に調査する.具体的には,同一プログラムを各 GPU で実行した時の消費電力,実行時間,温度等を計測し,GPU によってどの程度の個体差があるかを確認する.なお,今回の実験では,GPU の動作周波数や電力キャッピングの変更等の管理者権限が必要な実験は予定しておらず,ユーザ権限で可能な実験のみを実施する予定である.

課題名 アンドロメダ銀河南天のアーク構造の起源解明
代表者名(所属) 三木 洋平(東京大学 情報基盤センター)
すばる望遠鏡などを用いた近年の高精度測光観測によって,アンドロメダ銀河(M31)の周辺にはアンドロメダ・ストリームや Stream B と呼ばれる恒星が局所的に集積した不思議な構造が多数発見されている.こうした構造の多くは M31 がかつて経験した他の銀河との衝突の痕跡であると考えられているが,シミュレーションを用いて正確に検証された例は多くない.特に Stream B の形成シナリオに関しては,Stream B とアンドロメダ・ストリームが単一の銀河衝突によって形成されたとする説と,複数回の銀河衝突イベントにより独立に形成されたとする説が対立し,未だ謎に包まれている.そこで本研究では大規模 N 体シミュレーションを駆使して, Stream B とアンドロメダ・ストリームの単一銀河衝突説を検証し,この謎に迫る.そして,3 次元構造や速度構造といった観測可能な物理量を解析することで,将来の観測的検証に向けてのデータを提供することを目指す.

課題名 JAXA 内製 MPS 法プログラム p-flow による大規模流体解析
代表者名(所属) 宮島 敬明(宇宙航空研究開発機構)
我々は、次期国産旅客機の開発に資する大規模流体解析プログラム p-flow の研究開発を行っている。p-flow は Moving Particle Semi-Implicit(MPS)法をベースに、水などの大変形を伴う非圧縮性流体を解析対象にしている。MPS 法は粒子系シミュレーションに分類され、計算対象を多数の仮想粒子として分割し、各粒子と近傍粒子との相互作用から物理量の計算を行う。p-flow は大規模解析に対応すべく、近傍粒子の探索処理をスレッド並列化し、計算領域を複数プロセスに動的に分割して処理時間の短縮を図っている。これまでの研究で、GPU 化により近傍粒子探索は高速化されたが、動的領域分割とそれに伴う通信がボトルネックとなることがわかった。本 HPC チャレンジでは、実際の航空機への応用を念頭に、多数ノードにおける p-flow の適用可能性を検証する。