Supercomputing Division, Information Technology Center, The University Tokyo

Oakbridge-CX Supercomputer System
Selected Projects of the Large-Scale HPC Challenge

FY2022: Selected Projects

Thank you for applying for the Large-Scale HPC Challenge. After careful consideration based on the following criteria, the projects below were selected. (random order)
* The following projects were implemented under some restricted conditions in consideration of preventing the spread of COVID-19.

  • Research carried out using own coding or open-source programs.
  • Computational results can be deemed to be useful to science or have social impact.
  • Sets out the goal of using 1,024 nodes or more.
  • Feasible plans, and possibility of producing effects in a short time (each period of use is for a maximum of 8 hours.).
  • Provides useful information to the operator or user of the system.
1st term: Selected Projects | 2nd term: Selected Projects | 3rd term: Selected Projects

1st term: Selected Projects

Project Title Communication-Computation Overlapping for Preconditioned Parallel Iterative Solvers
前処理付き並列反復法における通信と計算のオーバーラップ
Representative's Name(Affiliatoin) Kengo NAKAJIMA(Information Technology Center, The University of Tokyo)
中島 研吾 (東京大学情報基盤センター)
クリロフ部分空間法による前処理付き反復法は広範な科学技術アプリケーションに使用されている。超並列環境下では,内積おける集団通信,行列ベクトル積等における一対一通信によるオーバヘッドが顕著となる。提案者は,特に一対一通信に着目し,三次元静的弾性問題(構造力学)を有限要素法で解く場合に得られる対称正定な大規模疎行列を共役勾配法(CG法)で解く場合について,通信と計算をオーバーラップさせ,更にOpenMPの動的スケジューリング機能により,通信オーバーヘッドを削減する手法に関する研究を実施してきた。本研究課題では,ICCG法等データ依存性を有する処理において,通信と計算を効果的にオーバーラップさせるための手法を提案し,Oakbridge-CX 1,024ノードを使用して効果を検証する。本研究課題で使用するGeoFEM/ICCGは,構造力学における三次元静的弾性問題を対象とした,有限要素法に基づくプログラムであり,導出された連立一次方程式を前処理付き反復法(ICCG法)によって解く。

2nd term: Selected Projects

Project Title Study of effective load-balancing by DCB library
DCBライブラリを使用した効果的な負荷分散の検討
Representative's Name(Affiliatoin) Masatoshi KAWAI(Information Technology Center, The University of Tokyo)
河合 直聡 (東京大学情報基盤センター)
さまざまなアプリケーションでスーパーコンピュータを効率的に使用するために、OpenMP+MPIのハイブリッド並列化が行われている。しかし、問題の特徴などから、均衡な負荷バランスの維持が難しい場合が多く、また、負荷バランスを維持するために、大きなコーディングコストが必要となされる場合も多い。著者らはこれらの問題に対応するために、Dynamic Core Binding(DCB)ライブラリを開発、研究している。DCBライブラリは、プロセス毎に割り当てるコア数を動的に変化させる機能を持っており、プロセス毎の負荷の不均衡をコアレベルで簡易に均衡化する環境を提供する。これまでの評価でDCBライブラリの使用により、アプリケーションの計算時間短縮や、計算時間をほとんど変化させずに消費電力を削減する効果を確認している。今回申し込ませていただく大規模HPCチャレンジでは、DCBライブラリを適用したLattice-Hmatrixの、大規模並列環境での評価を目的とする。加えて、ノード全体の消費電力への影響も合わせて、評価を行いたい。

3rd term: Selected Projects

Project Title Performance evaluation of tall-skinny QR factorization with column pivoting by Cholesky QR type algorithm on a large-scale parallel computer
大規模分散並列環境におけるコレスキーQR型アルゴリズムによる縦長行列の列ピボット付きQR分解の性能評価
Representative's Name(Affiliatoin) Takeshi Fukaya(Hokkaido University Information Initiative Center)
深谷 猛 (北海道大学 情報基盤センター)
行列の列ピボット付きQR分解(QRCP)は、行列の低ランク近似などの応用を持つ行列分解計算であり、特異値分解と比べて低コストで行列のランクに関する情報を取り扱うことができる。現在、我々は、縦長行列のQRCPに対して、コレスキーQR型アルゴリズムの開発を行っている。縦長行列の通常のQR分解に対するコレスキーQR型アルゴリズムは、演算の大半がLevel-3 BLASで実行可能かつ通信回避型アルゴリズムであり、その有効性はよく知られている。我々は、これを縦長行列のQRCPへ応用することを目指してアルゴリズムの研究開発を進めている。本課題では、開発中のコレスキーQR型QRCPアルゴリズムの分散並列版プログラムについて、強スケーリングの観点でその性能を評価する。これにより、大規模分散並列環境におけるコレスキーQR型QRCPアルゴリズムの性能を詳細に調査するとともに、その有効性を示すことを目指す。