Supercomputing Division, Information Technology Center, The University Tokyo

Oakbridge-CX Supercomputer System
Selected Projects of the Large-Scale HPC Challenge

FY2022: Selected Projects

Thank you for applying for the Large-Scale HPC Challenge. After careful consideration based on the following criteria, the projects below were selected. (random order)
* The following projects were implemented under some restricted conditions in consideration of preventing the spread of COVID-19.

  • Research carried out using own coding or open-source programs.
  • Computational results can be deemed to be useful to science or have social impact.
  • Sets out the goal of using 1,280 nodes.
  • Feasible plans, and possibility of producing effects in a short time (each period of use is for a maximum of 8 hours. Selected project of the 1st term was implemented in 11 hours).
  • Provides useful information to the operator or user of the system.
1st term: Selected Projects | 2nd term: Selected Projects

1st term: Selected Projects

Project Title Communication-Computation Overlapping for Preconditioned Parallel Iterative Solvers
前処理付き並列反復法における通信と計算のオーバーラップ
Representative's Name(Affiliatoin) Kengo NAKAJIMA(Information Technology Center, The University of Tokyo)
中島 研吾 (東京大学情報基盤センター)
クリロフ部分空間法による前処理付き反復法は広範な科学技術アプリケーションに使用されている。超並列環境下では,内積おける集団通信,行列ベクトル積等における一対一通信によるオーバヘッドが顕著となる。提案者は,特に一対一通信に着目し,三次元静的弾性問題(構造力学)を有限要素法で解く場合に得られる対称正定な大規模疎行列を共役勾配法(CG法)で解く場合について,通信と計算をオーバーラップさせ,更にOpenMPの動的スケジューリング機能により,通信オーバーヘッドを削減する手法に関する研究を実施してきた。本研究課題では,ICCG法等データ依存性を有する処理において,通信と計算を効果的にオーバーラップさせるための手法を提案し,Oakbridge-CX 1,024ノードを使用して効果を検証する。本研究課題で使用するGeoFEM/ICCGは,構造力学における三次元静的弾性問題を対象とした,有限要素法に基づくプログラムであり,導出された連立一次方程式を前処理付き反復法(ICCG法)によって解く。

2nd term: Selected Projects

Project Title Study of effective load-balancing by DCB library
DCBライブラリを使用した効果的な負荷分散の検討
Representative's Name(Affiliatoin) Masatoshi KAWAI(Information Technology Center, The University of Tokyo)
河合 直聡 (東京大学情報基盤センター)
さまざまなアプリケーションでスーパーコンピュータを効率的に使用するために、OpenMP+MPIのハイブリッド並列化が行われている。しかし、問題の特徴などから、均衡な負荷バランスの維持が難しい場合が多く、また、負荷バランスを維持するために、大きなコーディングコストが必要となされる場合も多い。著者らはこれらの問題に対応するために、Dynamic Core Binding(DCB)ライブラリを開発、研究している。DCBライブラリは、プロセス毎に割り当てるコア数を動的に変化させる機能を持っており、プロセス毎の負荷の不均衡をコアレベルで簡易に均衡化する環境を提供する。これまでの評価でDCBライブラリの使用により、アプリケーションの計算時間短縮や、計算時間をほとんど変化させずに消費電力を削減する効果を確認している。今回申し込ませていただく大規模HPCチャレンジでは、DCBライブラリを適用したLattice-Hmatrixの、大規模並列環境での評価を目的とする。加えて、ノード全体の消費電力への影響も合わせて、評価を行いたい。