GPU移行ポータルサイト
背景
東京大学情報基盤センターと筑波大学計算科学研究センターが共同で運営する最先端共同HPC基盤施設(JCAHPC)のOakforest-PACSシステム(OFP)は2022年3月末で無事運用を終了いたしました。現在、JCAHPCでは2025年1月運用開始を目指して、OFPの後継機種(OFP-II、ピーク性能200 PFLOPS以上を目標)の導入を進めております。スパコンへの性能要求とともに省電力、脱炭素化という昨今の状況を考慮すると、GPU等の演算加速装置の導入は不可避と考え、OFP-IIはGPU搭載ノードを中心としたシステムとする予定です(一部CPUのみのノードもあります)。 また、OFP-IIのプロトタイプとしてWisteria-Mercuryという小型のシステムを導入する予定です。
東大情報基盤センターのシステムはこれまで汎用CPUを中心としたシステムが中心でしたので、アプリケーションの移植が大きな課題となります。3,000人近い利用者の皆様に2025年1月にOFP-IIの利用を開始していただくためには、コードの移植を遅くとも2022年末までに開始する必要があります。そこで、2022年春に各社GPUを対象として7種類のプリベンチマークを実施し、その結果を踏まえ、6月にはMercury及びOFP-IIにはGPUとして「NVIDIA H100及びその後継機種」を採用することを既に決定しております。
2025年1月のOFP-IIの利用開始に向け、皆様の既存コードをご自身でGPUへ移植するために、役立つ情報を集約したサイトを公開しておりますので詳細は以下サイトをご参照ください。