Oakbridge-CX Supercomputer System
Selected Projects of the Large-Scale HPC Challenge
FY2023: Selected Projects
Thank you for applying for the Large-Scale HPC Challenge. After careful consideration based on the following criteria, the projects below were selected. (random order)
- Research carried out using own coding or open-source programs.
- Computational results can be deemed to be useful to science or have social impact.
- Sets out the goal of using 1,024 nodes or more.
- Feasible plans, and possibility of producing effects in a short time (each period of use is for a maximum of 24 hours.
- Provides useful information to the operator or user of the system.
1st term: Selected Projects
Project Title | Parallel Multigrid Method using Communication-Computation Overlapping 通信・計算オーバーラップによる並列多重格子法 |
---|---|
Representative's Name(Affiliatoin) | Kengo NAKAJIMA(Information Technology Center, The University of Tokyo) 中島 研吾 (東京大学情報基盤センター) |
Krylov部分空間法に基づく前処理付き反復法は,様々な科学技術計算で使用されている。大規模な並列計算機を使用する場合,ノード数の増加によって通信のオーバーヘッドは増加する傾向にあり,その削減は重要な課題である。並列有限要素法,差分法において,Halo通信と計算のオーバーラップ(CC-Overlapping)は,OpenMPの動的ループスケジューリングの機能と組み合わせて広く使用されている。この手法は,主として疎行列ベクトル積(SpMV),陽解法に適用されてきた。著者等による先行研究では,ICCG法などデータ依存性を含むプロセスにCC-Overlappingを適用するためのリオーダリング手法を提案し,Oakforest-PACS,Wisteria/BDEC-01(Odyssey)で高い並列性能を得ることができたが,CC-Overlappingの適用はSpMVに留まっていた。最近の研究では,ICCG法の前進後退代入にCC-Overlappingを適用する手法を提案し,並列ICCG法によって検証したのち,並列多重格子法を前処理とするMGCG法へ適用し,性能改善を得ることができた。更に,Halo通信を含む処理ではマスタースレッドに通信のみを実施させるマニュアルスケジューリング(Manual Scheduling)による最適化を適用した予備的計算では,更なる性能改善が得られている。大規模HPCチャレンジでは,マニュアルスケジューリングを含むこれらの手法について,Oakbridge-CXの最大1,024ノードを使用した性能評価を実施する。 |
2nd term: Selected Projects
Project Title | Performance evaluation of tall-skinny QR factorization with column pivoting by Cholesky QR type algorithm: an examination on the impact of algorithm improvement and a comparison with conventional algorithms コレスキーQR型アルゴリズムによる縦長行列の列ピボット付きQR分解の性能評価:アルゴリズム改良の効果の検証および既存アルゴリズムとの性能比較 |
---|---|
Representative's Name(Affiliatoin) | Takeshi Fukaya(Hokkaido University Information Initiative Center) 深谷 猛(北海道大学 情報基盤センター) |
行列の列ピボット付きQR分解(QRCP)は、特異値分解と比べて少ないコストで行列のランクに関する情報を取り扱うことができ、行列の低ランク近似等の応用を持つ。これまでには、我々は、縦長行列のQRCPに対して、コレスキーQR型のアルゴリズムを開発し、前回の大規模HPCチャレンジなどを通して、その有効性を確認している。今回の大規模HPCチャレンジでは、まず、前回の結果を踏まえた上で新たに取り組んだアルゴリズムの改良の効果を検証する。数学的な考察から、アルゴリズム中の一部の計算を省略可能であることを見出し、これによりアルゴリズムの効率化を行ったので、その効果を調査する。次に、前回の実施では対象としなかった既存手法との性能比較を行う。縦長行列のQRCPに対しては、通常のQR分解を行い、次に、得られた上三角行列に対してQRCPを行う手順が有効であることが関連文献の調査により分かった。そこで、今回の実施では、この手法との性能比較を行う。これらの二点に着目して、開発中のアルゴリズムの評価を実施し、その有効性を示すことを目指す。 |