東京大学情報基盤センター スーパーコンピューティング部門

Oakforest-PACS スーパーコンピュータシステム
「大規模 HPC チャレンジ」採択課題

2021年度 採択課題

このたびは、お申し込みをいただきどうもありがとうございました。以下の基準による厳正な審査のうえ、課題採択をさせていただきました(順不同)。
※新型コロナ感染症拡大防止に配慮して、一部条件等を変更しています。

  • 計算・結果の詳細を論文等も含めて公表できること。
  • 計算結果が科学的に有用、あるいは社会的なインパクトがあると考えられること。
  • flatモード4,200ノード、またはcacheモード3,200ノード、あるいはその両方の利用を目標としていること。
  • 計画に実現性があり、短時間で効果を示すことが可能であること (一回の利用期間は約 8 時間)。
  • 本センターの運用、ユーザーにとって有用な情報を提供すること。(加点評価項目)
第1回採択課題

第1回採択課題

課題名 温水冷却方式の効率に関する定量的評価に向けて
代表者名(所属) 庄司 文由(理化学研究所 計算科学研究センター 運用技術部門)
近年、温水冷却技術は、HPCシステムの冷却にかかるエネルギー効率を改善するために、多くのHPCセンターおよびデータセンターで採用されている。温水冷却においては、CPU等の冷水温度を高く設定することで、外気による自然な冷却が促されるため、冷凍機等を駆動するための電力が節約できる。一方で、CPU等のシリコンから構成される半導体は、高温で動作させればさせるほど、漏れ電流の増加により、消費電力が増加することが知られている。また、近年のCPUは、駆動温度や負荷が一定の水準を超えると、故障を回避するために自動的にクロック周波数や電圧を下げる機構を備えている。このため、温水冷却の効果を正しく評価するためには、冷却の電力を節約できるというポジティブな点に加え、上記のような消費電力の増加や、演算性能の低下のようなネガティブな点も等しく考慮に入れる必要がある。特にクロック周波数の低下による影響は、大規模なジョブでより深刻になると予想される。一般的に、CPU(プロセス)間で同期を取る際の性能は、最も遅いCPU(プロセス)に律速されるからである。以上を踏まえ、本研究では、単体および複数のCPUを使う様々なジョブを、異なる冷水温度で実行し、消費電力の増加および演算性能の低下を定量的に分析する。左記の分析に基づき、効率的な施設運用の実現に向けた、運用手順の確立を目指す。特に今回は、前回採択いただいた2019年10月の大規模HPCチャレンジで十分なデータが得られなかった複数CPUを使うジョブのケースについて重点的に調査したい。

▲ 採択課題 TOPへ