Supercomputing Division, Information Technology Center, The University Tokyo

Wisteria/BDEC-01 Supercomputer System
Selected Projects of the Large-Scale HPC Challenge

FY2022: Selected Projects

Thank you for applying for the Large-Scale HPC Challenge. After careful consideration based on the following criteria, the projects below were selected. (random order)
* The following projects were implemented under some restricted conditions in consideration of preventing the spread of COVID-19.

  • Research carried out using own coding or open-source programs.
  • Computational results can be deemed to be useful to science or have social impact.
  • Sets out the goal of using 4,096 nodes or more(Odyssey) or/and 36 nodes(Aquarius).
  • Feasible plans, and possibility of producing effects in a short time (each period of use is for a maximum of 8 hours).
  • Provides useful information to the operator or user of the system.
2nd term: Selected Projects | 3rd term: Selected Projects

2nd term: Selected Projects

Project Title Study of effective load-balancing by DCB library
DCBライブラリを使用した効果的な負荷分散の検討
Representative's Name(Affiliatoin) Masatoshi KAWAI(Information Technology Center, The University of Tokyo)
河合 直聡 (東京大学情報基盤センター)
さまざまなアプリケーションでスーパーコンピュータを効率的に使用するために、OpenMP+MPIのハイブリッド並列化が行われている。しかし、問題の特徴などから、均衡な負荷バランスの維持が難しい場合が多く、また、負荷バランスを維持するために、大きなコーディングコストが必要となされる場合も多い。著者らはこれらの問題に対応するために、Dynamic Core Binding(DCB)ライブラリを開発、研究している。DCBライブラリは、プロセス毎に割り当てるコア数を動的に変化させる機能を持っており、プロセス毎の負荷の不均衡をコアレベルで簡易に均衡化する環境を提供する。これまでの評価でDCBライブラリの使用により、アプリケーションの計算時間短縮や、計算時間をほとんど変化させずに消費電力を削減する効果を確認している。今回申し込ませていただく大規模HPCチャレンジでは、DCBライブラリを適用したLattice-Hmatrixの、大規模並列環境での評価を目的とする。加えて、ノード全体の消費電力への影響も合わせて、評価を行いたい。

3rd term: Selected Projects

Project Title Performance evaluation of tall-skinny QR factorization with column pivoting by Cholesky QR type algorithm on a large-scale parallel computer
大規模分散並列環境におけるコレスキーQR型アルゴリズムによる縦長行列の列ピボット付きQR分解の性能評価
Representative's Name(Affiliatoin) Takeshi Fukaya(Hokkaido University Information Initiative Center)
深谷 猛 (北海道大学 情報基盤センター)
行列の列ピボット付きQR分解(QRCP)は、行列の低ランク近似などの応用を持つ行列分解計算であり、特異値分解と比べて低コストで行列のランクに関する情報を取り扱うことができる。現在、我々は、縦長行列のQRCPに対して、コレスキーQR型アルゴリズムの開発を行っている。縦長行列の通常のQR分解に対するコレスキーQR型アルゴリズムは、演算の大半がLevel-3 BLASで実行可能かつ通信回避型アルゴリズムであり、その有効性はよく知られている。我々は、これを縦長行列のQRCPへ応用することを目指してアルゴリズムの研究開発を進めている。本課題では、開発中のコレスキーQR型QRCPアルゴリズムの分散並列版プログラムについて、強スケーリングの観点でその性能を評価する。これにより、大規模分散並列環境におけるコレスキーQR型QRCPアルゴリズムの性能を詳細に調査するとともに、その有効性を示すことを目指す。