東京大学情報基盤センター スーパーコンピューティング部門

Oakforest-PACS スーパーコンピュータシステム
「大規模 HPC チャレンジ」採択課題

2019年度 採択課題

このたびは、お申し込みをいただきどうもありがとうございました。以下の基準による厳正な審査のうえ、課題採択をさせていただきました(順不同)。

  • 計算・結果の詳細を論文等も含めて公表できること。
  • 計算結果が科学的に有用、あるいは社会的なインパクトがあると考えられること。
  • 8,192 ノード以上の利用を目標としていること。
  • 計画に実現性があり、短時間で効果を示すことが可能であること (一回の利用期間は約 21 時間)。
  • 本センターの運用、ユーザーにとって有用な情報を提供すること。(加点評価項目)
第1回採択課題 | 第2回採択課題 | 第3回採択課題

第1回採択課題

課題名 Oakforest-PACS システムにおける大規模疎行列ソルバーの最適化および性能評価
代表者名(所属) 中島 研吾 (東京大学 情報基盤センター)
有限要素法,差分法等の偏微分方程式数値解法は,大規模な疎行列を係数行列とする連立一次方程式を解くことに帰着される。昨今は前処理付きクリロフ部分空間法が幅広いアプリケーションに使用されている。本研究では,代表者の開発した,①ICCG 法ソルバー,②多重格子法(Multigrid)ソルバーの最適化,性能評価を実施し,Oakforest-PACS(OFP)システムに代表されるメニィコアクラスタにおける前処理付きクリロフ部分空間法の挙動に関する知見を得ることを目的とする。①については,有限要素法による三次元固体力学コード GeoFEM の ICCG ソルバーを対象として,Intel® MPI Library 2019 でサポートされる Asynchronous Progress Threads の機能を使用して,パイプライン型共役勾配法の高速化を実施する。②については,並列マルチグリッド法による三次元地下水シミュレーションプログラム pGW3D-FVM を対象として,SIMD ベクトル化に適した SELL-C-σ,混合精度演算導入によるノード単体の高速化を図るとともに,Adaptive Multilevel hCGA(AM-hCGA)法による並列性能向上を図るものである。更に並列多重格子法の自動チューニング手法に関する検討も実施する。また,①,②についてメニーコア向け OS 軽量カーネルである McKernel の評価も併せて実施する。

▲ 採択課題 TOPへ

第2回採択課題

課題名 ゲリラ豪雨予測のリアルタイム実証実験
代表者名(所属) 三好 建正 (理化学研究所 計算科学研究センター)
本申請課題では、理化学研究所において独自に開発している領域気象モデル・データ同化システムSCALE-LETKFを用いて、水平解像度250m、100メンバーで120km四方の領域をシミュレーションし、従来のレーダの100倍のデータを出力するフェーズドアレイ気象レーダの観測を30秒毎に同化するという、今までに例のない大規模な計算によって、これまでの技術では予測の出来なかったゲリラ豪雨の30分先までの予測をリアルタイムに行う実験を実施する。本実験で得られる知見を用いて、ビッグデータの転送・入出力、フェイルセーフなワークフロー、リアルタイムの全球予報から250m格子までのマルチスケールの接続、Oakforest-PACSにおける計算速度向上などの課題をクリアし、2020年夏季の東京オリンピック・パラリンピックでの実証実験を実現することを目標とする。

課題名 温水冷却方式の効率に関する定量的評価に向けて
代表者名(所属) 庄司 文由 (理化学研究所 計算科学研究センター 運用技術部門)
近年、温水冷却技術は、HPC システムの冷却にかかるエネルギー効率を改善するために、多くのHPC センターおよびデータセンターで採用されている。温水冷却においては、CPU 等の冷水温度を高く設定することで、外気による自然な冷却が促されるため、冷凍機等を駆動するための電力が節約できる。
一方で、CPU 等のシリコンから構成される半導体は、高温で動作させればさせるほど、漏れ電流の増加により、消費電力が増加することが知られている。また、近年のCPUは、駆動温度が一定の水準を超えると、故障を回避するために自動的にクロック周波数や電圧を下げる機構を備えている。
温水冷却の効果を正しく評価するためには、冷却の電力を節約できるというポジティブな点に加え、上記のような消費電力の増加や、演算性能の低下のようなネガティブな点も等しく考慮に入れる必要がある。特にクロック周波数の低下による影響は、大規模なジョブでより深刻になると予想される。一般的に、CPU(プロセス)間で同期を取る際の性能は、最も遅いCPU(プロセス)に律速されるからである。以上を踏まえ、本研究では、単体および複数のCPU を使う様々なジョブを、異なる冷水温度で実行し、消費電力の増加および演算性能の低下を定量的に分析する。左記の分析に基づき、効率的な施設運用の実現に向けた、運用手順の確立を目指す。

▲ 採択課題 TOPへ

第3回採択課題

課題名 大規模並列環境におけるシフト付きコレスキーQR 分解を用いた縦長行列の QR 分解計算の性能評価
代表者名(所属) 深谷 猛 (北海道大学 情報基盤センター)
縦長行列の QR 分解は,ベクトルの直交化に代表されるように,様々な数値計算手法で現れる基本的な行列計算の一種である。コレスキーQR 分解は,縦長行列の QR 分解を計算する手法の一つであり,高性能計算の面で優れた特徴を持っているが,一方で,計算精度・安定性に大きな欠点を抱えている。コレスキーQR 分解の精度・安定性を改善する手法として,再直交化を付与する手法を提案しており,更に最近,計算対象の行列がより悪条件な場合に対して,シフト付きコレスキーQR 分解と呼ばれる手法を提案した。本申請課題では,メニーコア CPU で構成される大規模な並列計算機環境における,シフト付きコレスキーQR 分解を用いた縦長行列の QR 分解の性能評価を行い,我々の提案手法の有効性を検証する。

▲ 採択課題 TOPへ