東京大学情報基盤センター スーパーコンピューティング部門

Wisteria/BDEC-01 スーパーコンピュータシステム
「大規模 HPC チャレンジ」採択課題

2023年度 採択課題

このたびは、お申し込みをいただきどうもありがとうございました。以下の基準による厳正な審査のうえ、課題採択をさせていただきました(順不同)。

  • 計算・結果の詳細を論文等も含めて公表できること。
  • 計算結果が科学的に有用、あるいは社会的なインパクトがあると考えられること。
  • 4,096 ノード以上(シミュレーションノード群(Odyssey))又は36ノード(データ・学習ノード群(Aquarius))、或いは両方の利用を目標としていること。
  • 計画に実現性があり、短時間で効果を示すことが可能であること (一回の利用期間は最大24時間)。
  • 本システムの運用、ユーザーにとって有用な情報を提供すること。
第1回採択課題 | 第2回採択課題

第1回採択課題

課題名 通信・計算オーバーラップによる並列多重格子法
代表者名(所属) 中島 研吾 (東京大学情報基盤センター)
Krylov部分空間法に基づく前処理付き反復法は,様々な科学技術計算で使用されている.大規模な並列計算機を使用する場合,ノード数の増加によって通信のオーバーヘッドは増加する傾向にあり,その削減は重要な課題である.並列有限要素法,差分法において,Halo通信と計算のオーバーラップ(CC-Overlapping)は,OpenMPの動的ループスケジューリングの機能と組み合わせて広く使用されている.この手法は,主として疎行列ベクトル積(SpMV),陽解法に適用されてきた.著者等による先行研究では,ICCG法などデータ依存性を含むプロセスにCC-Overlappingを適用するためのリオーダリング手法を提案し,Oakforest-PACS,Wisteria/BDEC-01(Odyssey)で高い並列性能を得ることができたが,CC-Overlappingの適用はSpMVに留まっていた.最近の研究では,ICCG 法の前進後退代入にCC-Overlappingを適用する手法を提案し,並列ICCG法によって検証したのち,並列多重格子法を前処理とするMGCG法へ適用し,性能改善を得ることができた.更に,Halo通信を含む処理ではマスタースレッドに通信のみを実施させるマニュアルスケジューリング(Manual Scheduling)による最適化を適用した予備的計算では,更なる性能改善が得られている.大規模HPCチャレンジでは,マニュアルスケジューリングを含むこれらの手法について,Odysseyの最大4,096ノードを使用した性能評価を実施する.

課題名 Wisteria-OにおけるCPUの電力性能ばらつきと縮退運転への応用に関する研究
代表者名(所属) 三輪 忍(電気通信大学 大学院情報理工学研究科)
本研究課題では,Wisteria-OにおけるCPUの電力性能ばらつきの調査,ならびに,上記の電力性能ばらつきを縮退運転に応用する方法を検討する.我々は,これまでに,Wisteria-O内の2,000ノード程度を対象にA64FX の電力性能ばらつきの調査,ならびに,電力性能ばらつきを縮退運転に応用する方法の検討を行い,その詳細を第188回HPC研究会にて報告した.本研究課題はこれを全ノードに拡張する.具体的には,全ノードにて同一のベンチマークアプリケーションを実行し,アプリケーションを実行中のCPUの消費電力と実行時間を計測する.そして,各CPUで計測した消費電力と実行時間を比較することにより,CPUによってアプリケーションの消費電力と実行時間にどの程度のばらつきが存在するかを評価・分析する.また,上記の計測結果をもとに,電力ばらつきを考慮してシャットダウンするノードを選択した場合の消費電力削減効果,ならびに,一定の電力制約下において削減可能なノード数の見積もりを行う.

▲ 採択課題 TOPへ

第2回採択課題

課題名 コレスキーQR型アルゴリズムによる縦長行列の列ピボット付きQR分解の性能評価:アルゴリズム改良の効果の検証および既存アルゴリズムとの性能比較
代表者名(所属) 深谷 猛(北海道大学 情報基盤センター)
行列の列ピボット付きQR分解(QRCP)は,特異値分解と比べて少ないコストで行列のランクに関する情報を取り扱うことができ,行列の低ランク近似等の応用を持つ.これまでには,我々は,縦長行列のQRCPに対して,コレスキーQR型のアルゴリズムを開発し,前回の大規模HPCチャレンジなどを通して,その有効性を確認している.今回の大規模HPCチャレンジでは,まず,前回の結果を踏まえた上で新たに取り組んだアルゴリズムの改良の効果を検証する.数学的な考察から,アルゴリズム中の一部の計算を省略可能であることを見出し,これによりアルゴリズムの効率化を行ったので,その効果を調査する.次に,前回の実施では対象としなかった既存手法との性能比較を行う.縦長行列のQRCPに対しては,通常のQR分解を行い,次に,得られた上三角行列に対してQRCPを行う手順が有効であることが関連文献の調査により分かった.そこで,今回の実施では,この手法との性能比較を行う.これらの二点に着目して,開発中のアルゴリズムの評価を実施し,その有効性を示すことを目指す.

課題名 低通信超並列チャンネル流 DNS コードの開発
代表者名(所属) 山本 義暢(山梨大学 大学院総合研究部)
世界最高レイノルズ数条件下における壁面乱流場直接数値計算の実現を目指し,超並列・低容量・低通信擬スペクトル法コードを開発している.本コードでは,擬スペクトル法の主要演算部である高速フーリエ変換(FFT)方向のx( or y)軸と壁垂直方向z 軸の2 次元領域分割により超並列計算を実現している.FFT 方向(x & y 軸)の計算においては並列効果を得るために分割軸の転置(x ⇔ y)が必要となり,alltoall 通信(a2a)が発生する.このa2a コストはx (ory)軸分割領域をFX システム特有のtofu インタコネクトにおける近接ノード配置とすることで低減される.実際コード上の領域分割(2 次元)とtofu インタコネクト上の形状(2 次元)を一致させ,FFT 方向分割をtofu 座標上の2(12 ノード)程度に配置することにより高効率演算が実現可能となっている.しかしこの方法ではFX システム最大構成クラスの利用が困難となる.そこで本研究では,tofu インタコネクト3 次元形状においてコード上の2 次元領域分割配置を最適化することにより,FX システム最大構成での高効率演算を可能とすることを目標とする.

▲ 採択課題 TOPへ