HOME > サービス案内 > 大規模 HPC チャレンジ > 採択課題

FX10 スーパーコンピュータシステム「大規模 HPC チャレンジ」採択課題

2014年度 採択課題決定

 このたびは、お申し込みをいただきどうもありがとうございました。以下の基準による厳正な審査のうえ、課題採択をさせていただきました(順不同)。

  • 自作コード、またはオープンソースプログラムによる研究であること。
  • 当該コードについて、1,000 コア以上の利用実績があること。または、センターで実施してきた、「512 ノードサービス」「512 ノード利用大規模 HPC 研究」での利用実績があること。
  • 計算結果が科学的に有用、あるいは社会的なインパクトがあると考えられること。
  • 本センターの運用、ユーザーにとって有用な情報を提供すること。
  • 4,800 ノードの利用を目標としていること。
  • 計画に実現性があり、短時間で効果を示すことが可能であること (一回の利用期間は最大 24 時間)。

第1回採択課題

課題名 RDMA 機能に基づく通信ライブラリ適用による改良型 hCGA 法による並列多重格子法ソルバーの最適化および性能評価
代表者名(所属) 中島 研吾(東京大学 情報基盤センター)
 連立一次方程式の反復解法、前処理手法としての多重格子法は、問題規模が増加しても収束までの反復回数が変化しないスケーラブルな手法であり、大規模問題向けの解法として注目されている。並列計算においてもその効果が確認されているが、コア数が増加した場合、特に粗いレベルにおける通信によるオーバーヘッドによる低下が懸念されている。この問題を解決するために、申込者はこれまでに、CGA 法(Coarse Grid Aggregation)、その改良版であるhCGA 法(Hierarchical CGA)を提案し、Oakleaf-FX 4,096 ノードを使用して高いスケーラビリティを得られることを示して来た。本提案では申込者の一人が開発しているFujitsu FX10 のインターコネクトが有するRDMA(Remote Direct Memory Access)機能に基づくPersistent Communication をサポートするMPI ライブラリを適用し、更なる最適化を図る。

▲ 採択課題 TOPへ

第2回採択課題

課題名 ppOpen-HPCライブラリ群を利用する地震波動-建築物振動連成マルチスケール・マルチフィジックスシミュレーション
代表者名(所属) 松本 正晴(東京大学 情報基盤センター)
 地震による建物の揺れをその震源から解析するためには100km×100km程度以上の広い領域で起きる地震波動の進展と、数10m×数10m程度の狭い領域で起きる建物の振動を同時に解く必要がある。しかしこのような解析は、対象とするスケール・物理が両者で大きく異なるため、そのモデル化から実装・評価が非常に難しい。そこで本研究課題では、地震波動解析と建築物振動解析それぞれに適した既存の解析コードを、カップラを介して連成させるマルチスケール・マルチフィジックスシミュレーションを目指す。すなわち、我々の研究グループで開発が進められているppOpen-HPCライブラリ群を用いて、有限差分法(FDM)による地震波動の広域的解析と有限要素法(FEM)による建築物振動の局所的解析をカップラにより連成させ、FDM-FEM大規模連成解析を実証するとともに、その性能・精度評価、課題点の洗い出し等を行う。

課題名 コスタス配置問題に対する超並列組み合わせ最適化解法
代表者名(所属) 須田 礼仁(東京大学 情報理工学系研究科)
 本研究では、コスタス配置問題(以下 CAP と略す)の史上最大規模問題(n=32)を、我々が開発した制約ベースの局所探索アルゴリズムである Adaptive Search で解く。
CAPは、ノイズにつよいレーダーとソナーの周波数を配置するという実世界の問題をモデル化したものである。CAP の探索空間はサイズ n に対して指数的となり、探索が困難となる。45年前に提唱されて以来、n = 32 に解があるかどうかは未解決問題となっている。
我々はAdaptive Search の効率的な並列実装とともに、その実行所要時間を正確に見積もる手法を開発している。これに基づいて評価したところ、FX10 4,800ノードでは n = 32 の問題に対して約24時間以内に解が得られると見積もっている。
これを達成することにより、CAP問題の新記録が達成されるだけではなく、探索問題の超大規模並列化に関する多数の知見が得られると期待される。

課題名 並列多重格子法ソルバーの最適化および性能評価
代表者名(所属) 中島 研吾 (東京大学 情報基盤センター)
 連立一次方程式の反復解法、前処理手法としての多重格子法は、問題規模が増加しても収束までの反復回数が変化しないスケーラブルな手法であり、大規模問題向けの解法として注目されている。並列計算においてもその効果が確認されている。本研究は2 つのフェーズに別れている。第1 フェーズは2013 年6 月にLinpack に代わるスーパーコンピュータシステムの新しい性能評価ベンチマークとして提案されているHPCG( https://software.sandia.gov/hpcg/)のチューニング及び性能計測である。HPCG は三次元ポアソン方程式を差分格子のような規則的形状において有限要素法によって離散化して得られる疎行列を係数とする連立一次方程式を幾何学的多重格子法前処理による共役勾配法(Conjugate Gradient Method preconditioned by Geometric Multigrid)を使用して解くベンチマークである。第2 フェーズは申込者がこれまで実施してきた幾何学的多重格子法前処理による並列共役勾配法における通信手法削減に関する研究である。申込者の開発したhCGA 法(Hierarchical Coarse Grid Aggregation)を更に改良し、計算を実行し、性能を計測する。

▲ 採択課題 TOPへ

第3回採択課題

課題名 800 億粒子級の DEM シミュレーションの性能評価
代表者名(所属) 片桐 孝洋(東京大学 情報基盤センター)
 本提案では、FX10 の全系を用い、DEM シミュレーションにおいて800 億粒子級のシミュレーションの実現可能性を示す。
 DEM シミュレーションでは、接触判定計算の時間が多くを占めるが、データ依存関係があるためにスレッド並列化効率が問題となる。そこで我々は、OpenMP を用いた並列化において、原理的に従来法に対して高いスレッド並列性を達成するマルチカラー接触判定法を提案した。さらに、マルチカラー接触判定法の MPI 並列プログラムを開発し、世界にさきがけてマルチカラー接触判定法のハイブリッド MPI/OpenMP プログラムを実現した。現状では、256 ノードまでの弱スケーリングを確認しており、FX10 の256 ノードで約47 億粒子の DEM シミュレーションが実現可能であることを検証している。
 そこで本提案では、開発した MPI/OpenMP 並列化されたプログラムを FX10 の全系で実行し、800 億粒子級の DEM シミュレーションのベンチマークを行う。スパコンにおける DEM 計算規模の飛躍的向上を示すことで、当該分野のブレークスルーを促進させる。

課題名 最適複合化固有値解析ルーチンによる 100 万次元行列の電子状態計算
代表者名(所属) 星 健夫(鳥取大学 工学研究科)
 CREST プロジェクト(ポストペタ領域)の成果物である最適複合化固有値解析ルーチンを用いて、実問題(電子状態計算)の 100 万次元一般化固有値問題(世界最大)にチャレンジする。先端的ルーチンである EigenExa(理研今村ら)・ELPA を複合化させている。EigenExa を使った標準固有値問題計算としては 100 万次元計算が達成されている。しかし、電子状態計算の多くは一般化固有値問題計算であり、上記複合ルーチンを構成することで、これに取り組んでいる。Oakleaf-fx 上で 22.5 万次元まで、「京」上で 43 万次元計算までが達成されている。ルーチンは次世代(低 B/F)マシンを想定しているため、「京」より低 B/F である Oakleaf-fx で性能評価することで、次世代マシンへの指針を得る。得られたルーチンは、数理的ミドルウェア・ミニアプリとして公開予定であると同時に、申請者らによる電子状態計算ソフト ELSES に搭載予定である。

課題名 pK-Open- APPL/FVM 最適化および性能評価
代表者名(所属) 中島 研吾(東京大学 情報基盤センター)
 pK-Open-APPL/FVM は、局所細分格子に基づくボクセル型有限体積法によるアプリケーション開発環境であり、「自動チューニング機構を有するアプリケーション開発・実行環境:ppOpen-HPC」の一部として開発されている。
 pK-Open-APPL/FVM では幾何学的多重格子法を前処理手法とする共役勾配法( MGCG ) 法によって連立一次方程式を解いている。pK-Open-APPL/FVM における並列 MGCG 法は、申込者の開発した Sliced-ELL 法に基づく係数格納法(従来ELL 法と比較して30%の性能向上)、hCGA 法(Hierarchical Coarse Grid Aggregation)による通信削減手法(従来の CGA 法と比較して最大6 倍以上の性能向上)に基づく最適化手法が適用されている。本研究では、pK-Open-APPL/FVM の最適化、性能評価を目的として、並列 MGCG 法ソルバーの評価とともに、並列局所細分化メッシュ生成機能の評価を併せて実施する。
 並列 MGCG 法ソルバーについては、片方向通信の導入によって、hCGA 法の更なる高速化を図る。

▲ 採択課題 TOPへ