Supercomputing Division, Information Technology Center, The University Tokyo

Wisteria/BDEC-01 Supercomputer System
Selected Projects of the Large-Scale HPC Challenge

FY2023: Selected Projects

Thank you for applying for the Large-Scale HPC Challenge. After careful consideration based on the following criteria, the projects below were selected. (random order)

  • Research carried out using own coding or open-source programs.
  • Computational results can be deemed to be useful to science or have social impact.
  • Sets out the goal of using 4,096 nodes or more(Odyssey) or/and 36 nodes(Aquarius).
  • Feasible plans, and possibility of producing effects in a short time (each period of use is for a maximum of 24 hours).
  • Provides useful information to the operator or user of the system.
1st term: Selected Projects | 2nd term: Selected Projects | 3rd term: Selected Projects

1st term: Selected Projects

Project Title Parallel Multigrid Method using Communication-Computation Overlapping
通信・計算オーバーラップによる並列多重格子法
Representative's Name(Affiliatoin) Kengo NAKAJIMA(Information Technology Center, The University of Tokyo)
中島 研吾 (東京大学情報基盤センター)
Krylov部分空間法に基づく前処理付き反復法は,様々な科学技術計算で使用されている。大規模な並列計算機を使用する場合,ノード数の増加によって通信のオーバーヘッドは増加する傾向にあり,その削減は重要な課題である。並列有限要素法,差分法において,Halo通信と計算のオーバーラップ(CC-Overlapping)は,OpenMPの動的ループスケジューリングの機能と組み合わせて広く使用されている。この手法は,主として疎行列ベクトル積(SpMV),陽解法に適用されてきた。著者等による先行研究では,ICCG法などデータ依存性を含むプロセスにCC-Overlappingを適用するためのリオーダリング手法を提案し,Oakforest-PACS,Wisteria/BDEC-01(Odyssey)で高い並列性能を得ることができたが,CC-Overlappingの適用はSpMVに留まっていた。最近の研究では,ICCG法の前進後退代入にCC-Overlappingを適用する手法を提案し,並列ICCG法によって検証したのち,並列多重格子法を前処理とするMGCG法へ適用し,性能改善を得ることができた。更に,Halo通信を含む処理ではマスタースレッドに通信のみを実施させるマニュアルスケジューリング(Manual Scheduling)による最適化を適用した予備的計算では,更なる性能改善が得られている。大規模HPCチャレンジでは,マニュアルスケジューリングを含むこれらの手法について,Odysseyの最大4,096ノードを使用した性能評価を実施する。

Project Title Study of Performance and Power-Efficiency Variation between CPUs and its Application to Fall Back in Wisteria-O
Wisteria-OにおけるCPUの電力性能ばらつきと縮退運転への応用に関する研究
Representative's Name(Affiliatoin) MIWA Shinobu(Graduate School of Information Systems, The University of Electro-Communications)
三輪 忍(電気通信大学 大学院情報理工学研究科)
本研究課題では,Wisteria-OにおけるCPUの電力性能ばらつきの調査,ならびに,上記の電力性能ばらつきを縮退運転に応用する方法を検討する.我々は,これまでに,Wisteria-O内の2,000ノード程度を対象にA64FX の電力性能ばらつきの調査,ならびに,電力性能ばらつきを縮退運転に応用する方法の検討を行い,その詳細を第188回HPC研究会にて報告した.本研究課題はこれを全ノードに拡張する.具体的には,全ノードにて同一のベンチマークアプリケーションを実行し,アプリケーションを実行中のCPUの消費電力と実行時間を計測する.そして,各CPUで計測した消費電力と実行時間を比較することにより,CPUによってアプリケーションの消費電力と実行時間にどの程度のばらつきが存在するかを評価・分析する.また,上記の計測結果をもとに,電力ばらつきを考慮してシャットダウンするノードを選択した場合の消費電力削減効果,ならびに,一定の電力制約下において削減可能なノード数の見積もりを行う.

▲ TOP

2nd term: Selected Projects

Project Title Performance evaluation of tall-skinny QR factorization with column pivoting by Cholesky QR type algorithm: an examination on the impact of algorithm improvement and a comparison with conventional algorithms
コレスキーQR型アルゴリズムによる縦長行列の列ピボット付きQR分解の性能評価:アルゴリズム改良の効果の検証および既存アルゴリズムとの性能比較
Representative's Name(Affiliatoin) Takeshi Fukaya(Hokkaido University Information Initiative Center)
深谷 猛(北海道大学 情報基盤センター)
行列の列ピボット付きQR分解(QRCP)は、特異値分解と比べて少ないコストで行列のランクに関する情報を取り扱うことができ、行列の低ランク近似等の応用を持つ。これまでには、我々は、縦長行列のQRCPに対して、コレスキーQR型のアルゴリズムを開発し、前回の大規模HPCチャレンジなどを通して、その有効性を確認している。今回の大規模HPCチャレンジでは、まず、前回の結果を踏まえた上で新たに取り組んだアルゴリズムの改良の効果を検証する。数学的な考察から、アルゴリズム中の一部の計算を省略可能であることを見出し、これによりアルゴリズムの効率化を行ったので、その効果を調査する。次に、前回の実施では対象としなかった既存手法との性能比較を行う。縦長行列のQRCPに対しては、通常のQR分解を行い、次に、得られた上三角行列に対してQRCPを行う手順が有効であることが関連文献の調査により分かった。そこで、今回の実施では、この手法との性能比較を行う。これらの二点に着目して、開発中のアルゴリズムの評価を実施し、その有効性を示すことを目指す。

▲ TOP