Supercomputing Division, Information Technology Center, The University Tokyo

Oakforest-PACS Supercomputer System
Selected Projects of the Large-Scale HPC Challenge

FY2021: Selected Projects

Thank you for applying for the Large-Scale HPC Challenge. After careful consideration based on the following criteria, the projects below were selected. (random order)
* We have implemented the Large-Scale HPC Challenge under some restricted conditions in consideration of preventing the spread of COVID-19.

  • Research carried out using own coding or open-source programs.
  • Computational results can be deemed to be useful to science or have social impact.
  • Set out the goal of using 4,200 nodes(flat mode) or 3,200 nodes (cache mode) or both flat mode(4,200 nodes) and cache mode (3,200 nodes).
  • Feasible plans, and possibility of producing effects in a short time (each period of use is for a maximum of 8 hours).
  • Provides useful information to the operator or user of the system.
1st term: Selected Projects

1st term: Selected Projects

Project Title Toward a quantitative evaluation of the efficiency of a hot water cooling method
温水冷却方式の効率に関する定量的評価に向けて
Representative's Name(Affiliatoin) Fumiyoshi SHOJI (Operations and Computer Technologies Division, RIKEN Center for Computational Science)
庄司 文由(理化学研究所 計算科学研究センター 運用技術部門)
近年、温水冷却技術は、HPCシステムの冷却にかかるエネルギー効率を改善するために、多くのHPCセンターおよびデータセンターで採用されている。温水冷却においては、CPU等の冷水温度を高く設定することで、外気による自然な冷却が促されるため、冷凍機等を駆動するための電力が節約できる。一方で、CPU等のシリコンから構成される半導体は、高温で動作させればさせるほど、漏れ電流の増加により、消費電力が増加することが知られている。また、近年のCPUは、駆動温度や負荷が一定の水準を超えると、故障を回避するために自動的にクロック周波数や電圧を下げる機構を備えている。このため、温水冷却の効果を正しく評価するためには、冷却の電力を節約できるというポジティブな点に加え、上記のような消費電力の増加や、演算性能の低下のようなネガティブな点も等しく考慮に入れる必要がある。特にクロック周波数の低下による影響は、大規模なジョブでより深刻になると予想される。一般的に、CPU(プロセス)間で同期を取る際の性能は、最も遅いCPU(プロセス)に律速されるからである。以上を踏まえ、本研究では、単体および複数のCPUを使う様々なジョブを、異なる冷水温度で実行し、消費電力の増加および演算性能の低下を定量的に分析する。左記の分析に基づき、効率的な施設運用の実現に向けた、運用手順の確立を目指す。特に今回は、前回採択いただいた2019年10月の大規模HPCチャレンジで十分なデータが得られなかった複数CPUを使うジョブのケースについて重点的に調査したい。

▲ Return to the top of the Selected Projects