東京大学情報基盤センター スーパーコンピューティング部門

Miyabi スーパーコンピュータシステム
「大規模 HPC チャレンジ」採択課題

2025年度 採択課題

このたびは、お申し込みをいただきどうもありがとうございました。以下の基準による厳正な審査のうえ、課題採択をさせていただきました(順不同)。

  • 計算・結果の詳細を論文等も含めて公表できること。
  • 計算結果が科学的に有用、あるいは社会的なインパクトがあると考えられること。
  • 1,024 ノード以上(演算加速ノード群(Miyabi-G))又は184 ノード(汎用CPUノード群(Miyabi-C))、或いは両方の利用を目標としていること。
  • 計画に実現性があり、短時間で効果を示すことが可能であること (一回の利用期間は最大24時間)。
  • 本システムの運用、ユーザーにとって有用な情報を提供すること。

第1回採択課題

課題名 Miyabi-G におけるHPLの電力最適化
代表者名(所属) 朴 泰祐 (筑波大学計算科学研究センター)
本研究では、Miyabi-G全系を用いたHPL測定を行い、その際のエネルギー最適化について検討する。Top500 におけるHPL 測定では、ノードのGH200 のパッケージ電力を900 W、GPU 電力を700 W に設定し、最大性能を発揮する条件の下で測定を行っている。この設定でHPL は46.80 PFLOPS、電力あたり性能は47.59 GFLOPS/Wを達成した。しかし、より適切な電力制御を設定することで効率が向上する可能性がある。本研究では、CPUFreq governor の選択などを通じて、CPU とGPU の電力バジェットをバランスよく分け合い、全体の電力あたり性能を向上させることを目指す。測定結果を基に、より効率的な運用条件を探り、今後の各計算ノード設定を再検討する予定である。

課題名 AIを用いた銀河進化シミュレーション
代表者名(所属) 平島 敬也(理化学研究所)
本研究では、個々の恒星まで再現された超高解像度銀河形成シミュレーションの実現を目指す。銀河のシミュレーションでは、分解能を上げるほど、より高密度かつ短時間で変化する部分まで分解できるようになり、その結果、必要とされる時間刻みが短くなる(超新星爆発など)ことで、単に分解能が上がった分以上に計算コストが増加する問題がある。そこで、計算のボトルネックである超新星フィードバックを深層学習を応用して高精度・高速に再現することで、銀河形成シミュレーション全体の高速化を図る。これまで、本コードはスーパーコンピュータ「富岳」の95%である15万ノードを使って並列化性能を測定した。また、将来のGPUなどの加速器を利用したさらなる高速化を見据えて、GPU対応の最適化も進めてきた。しかし、これらの限定的な実装であったため、「Miyabi」の256ノードを用いて10%程度の効率に留まっている。全系実行では、GPU向けに改善したSIMD実装などを用いてMiyabiの全系実行を行い、スケーリング性能の評価を行う。

課題名 JAXを利用して実装した第一原理量子モンテカルロ法コードのベンチマーク
代表者名(所属) 中野 晃佑(物質・材料研究機構)
申請者は、GPUがメインとなるHPCの開発動向を踏まえ、これまでFortran90で開発してきた第一原理量子モンテカルロ法の計算コードを、Googleが開発するJAXを使って、Pythonでフルスクラッチから書き直した(jQMC)。jQMCの初期リリースversionは完成しており、現在、論文執筆に向けてデータを収集中である。論文執筆にあたっては、jQMCの2つの性能指標を明らかにするベンチマーク計算が必要である。1つは、単GPUを如何に効率よく使えているかというベンチマークである。これは1GPUあたりに大量のwalkersをアサインして、実効的な計算速度向上を狙うものである。この指標は、九州大学のGPUマシンである玄界を利用して確認した。もう1つは、複数GPUsを如何に効率よく使えているか、つまり、weak-scalingの計測である。第一原理量子モンテカルロ法における実装の1つである拡散量子モンテカルロ法(DMC)においては、射影演算間にMPIによるノード間通信が必要になるため、普通のマルコフチェーンモンテカルロ法(MCMC)とは異なり、実行効率が完全に100%とはならない。このDMCのweakscalingを、miyabi-gのノードを最上限(1090ノード:1090GPUs)まで利用して計測したい。

▲ 採択課題 TOPへ