東京大学情報基盤センター スーパーコンピューティング部門

Oakforest-PACS スーパーコンピュータシステム
「大規模 HPC チャレンジ」採択課題

2017年度 採択課題

このたびは、お申し込みをいただきどうもありがとうございました。以下の基準による厳正な審査のうえ、課題採択をさせていただきました(順不同)。

  • 自作コード、またはオープンソースプログラムによる研究であること。
  • 計算結果が科学的に有用、あるいは社会的なインパクトがあると考えられること。
  • 本センターの運用、ユーザーにとって有用な情報を提供すること。
  • 8,208 ノードの利用を目標としていること。
  • 計画に実現性があり、短時間で効果を示すことが可能であること (一回の利用期間は最大 24 時間)。
第1回採択課題 | 第2回採択課題 | 第3回採択課題

第1回採択課題

課題名 IHK/McKernel 軽量カーネルOS の大規模評価
代表者名(所属) Balazs Gerofi(理化学研究所計算科学研究機構)
Interface for Heterogeneous Kernels (IHK) is a software framework that facilitates the deployment and execution of specialized operating systems kernels on a subset of node resources (e.g., CPUs and memory) in many-core systems. McKernel is a lightweight co-kernel, implemented on top of IHK, that runs side-by-side with Linux, optionally offloading OS services to the Linux kernel. The two main advantages of IHK/McKernel from an HPC perspective are lightweight kernel scalability; and the retention of the full Linux APIs. This proposal aims at performing a comparative evaluation of Linux and McKernel at the full potential of the OFP machine. The following applications will be evaluated using up to 8K nodes: GeoFEM (Tokyo Univ.), CCS-QCD (Hiroshima Univ.), AMG2013 (Coral), miniFE (CORAL), HACC (CORAL), HPCG (CORAL), Lammps (CORAL), MILC (CORAL), Nekbone (CORAL), QBOX (CORAL), UMT2013 (CORAL), Lulesh (CORAL), MCB (CORAL).
In addition, if time allows we also intend to evaluate a partial OmniPath (HFI1) device driver incorporated version of McKernel that further improves communication performance.

課題名 SELL-C-σ疎行列格納法による自動チューニング付き並列多重格子法ソルバーの最適化および性能評価
代表者名(所属) 中島 研吾(東京大学情報基盤センター)
連立一次方程式の反復解法,前処理手法としての多重格子法は,問題規模が増加しても収束までの反復回数が変化しないスケーラブルな手法であり,大規模問題向けの解法として注目されており,並列計算においてもその効果が確認されている。申込者は,Sliced ELL 法を ILU 型前処理に世界に先駆けて導入することによるノード単体性能の向上,更にコア数が増加した場合, 特に粗いレベルにおける通信の改善のために hCGA 法(Hierarchical CGA)を提案し,Oakleaf-FX 4,096 ノードを使用して高いスケーラビリティを得られることを示し,内外で高い評価を受けてきた。本提案では,これらの機能を有する並列マルチグリッド法による三次元地下水シミュレーションプログラム pGW3D-FVM について,更に SIMD ベクトル化に適した SELL-C-σ を導入し,応募者の提案した多重格子法向け自動チューニング手法を適用することによって,Oakforest-PACS 向けに最適化を実施し,8,192 ノードを使用した評価を実施するものである。また,メニーコア向け OS 軽量カーネルである McKernel の評価も併せて実施する。

課題名 磁性体を記述する疎行列の数値対角化における大規模並列計算の挑戦
代表者名(所属) 中野 博生(兵庫県立大学大学院物質理学研究科)
与えられた行列の固有値を求める固有値問題として、どのくらいの大きさの次元を持つ行列まで計算が実際に行えるのか、という素朴な疑問を答えるべく、そのような大規模並列計算に挑戦する。挑戦の舞台となる物理系は、絶縁体磁性を記述うする量子スピン系である。挑戦する最大の行列次元は約18兆であり、この規模の次元が実現されれば世界記録となる事例である。この規模での計算結果を得て、2016 年度ノーベル物理学賞に輝いた Haldane が提唱した整数スピン系が示す励起ギャップなどの精密評価を行う。実施予定のプログラムは、京コンピュータや Oakforest-PACS で既に実行確認済みで、本研究の最大規模の実現可能性を強く示唆するウィークスケーリングも両方の最先端スーパーコンピュータで良好な結果を得ている。Haldane によって提唱された新奇な量子相は、対称性に守られたトポロジカル相として一般化されており、本研究の成果は、最近注目されるトポロジカル物質の研究に、重要なブレークスルーをもたらすと期待される。

▲ 採択課題 TOPへ

第2回採択課題

課題名 2.5次元アルゴリズムを用いた高性能PDGEMMの開発
代表者名(所属) 椋木大地(理化学研究所 計算科学研究機構)
スーパーコンピュータの並列数が増大し、集団通信を含むプログラムの性能において通信コストが課題となっている。これに対して各種の通信削減型アルゴリズムが提案されている。Solomonikらは並列行列積(PDGEMM)の通信削減型アルゴリズムとして2.5次元アルゴリズムを提案した。2.5次元アルゴリズムは3次元のプロセスグリッド上に2次元分散された行列をスタックして計算するため、ScaLAPACKのPDGEMM等、従来の2次元アルゴリズムによる実装の代用とするには、データの再分散が必要となる。我々は内部で再分散を行うことで、従来の2次元アルゴリズムを用いたPDGEMMと互換性のある2D互換2.5D-PDGEMMを実装し、スーパーコンピュータ「京」において性能を評価してきた。本研究では我々の実装をOakforest-PACSにおいて性能評価することで、現世代および次世代のスーパーコンピュータ環境における2D互換2.5D-PDGEMMの有効性と実装上の課題を明らかにする。そして現在のPDGEMMを置き換える新たなPDGEMM実装の開発を目指す。

課題名 2+1 フレーバー格子 QCD におけるマスターフィールドシミュレーション
代表者名(所属) 藏増嘉伸(筑波大学 計算科学研究センター)
過去40年近く, 格子QCDは主要な系統誤差を克服しつつ, 主にハドロン単体の諸性質解明を目指して来た. 現在の世界的な状況において, 以下の 2 つの大きな問題点が存在する. まず, 物理点直上でシミュレーションが可能になったことは事実だが, 実際に物理点(およびその近傍)のみで物理量の評価を行えるほどの精度を得るレベルには至っていない. もう一つは, 単一の物理パラメータを持つゲージ配位からユニバーサルに様々な物理量の高精度精密計算ができているわけではなく, そのことが格子QCD計算の予言能力を毀損している. これまでの格子QCD研究が, 計算結果と実験値との整合性を示すことに注力してきたこともそのためである. 本研究課題では, 格子QCDにおいて世界初となるmaster-fieldシミュレーションを行うことによって上記2つの課題を克服し, 格子QCD計算の予言能力を格段に向上させることによって, 標準理論を超える新たな物理の探求を目指す. ただし, 今回の大規模HPCチャレンジにおいては, 2564格子サイズのゲージ配位生成に特化した計算に注力する.

▲ 採択課題 TOPへ

第3回採択課題

課題名 櫻井・杉浦法とシフトCG 法を用いた実空間差分法に基づく第一原理伝導計算の高速化
代表者名(所属) 小野倫也(筑波大学 計算科学研究センター)
実空間差分法を用いた第一原理電子状態・伝導特性計算コードRSPACE を開発している。第一原理伝導計算は、電極自己エネルギー及び散乱領域のグリーン関数の計算が計算規模拡大の障害となっている。申請者らは、櫻井杉浦法による高速固有値問題解法とシフト共役勾配法による大規模連立方程式解法を組み合わせ、これらのボトルネックの計算コストを大幅に削減した。そして、これまで高々数百原子程度であった第一原理伝導計算の計算モデルを、OFP512 ノードを使用して2000 原子以上に拡大することに成功した。改良した計算コードの実行時間の90%以上は大規模疎係数行列に対する連立方程式解法の実行に費やされ、当該部分が優れた並列化効率と6~9%の実行効率を達成することを確認している。得られた成果を学会に投稿するため、OFP でのフルノード実行により、計算コードの性能評価と1 万原子程度に計算モデルを拡大した伝導計算を行う。

▲ 採択課題 TOPへ