Deep Learning (DL)は、大量のデータから特徴量を抽出するDeep Neural Network (DNN)を用いた機械学習の手法として幅広い分野に応用されているが、 その特徴量を決定するための学習(training)には膨大な計算が必要であり、非 常に長い時間を要することが知られている。 Oakforest-PACSに搭載されているKnights Landing (KNL)プロセッサには、 512bit幅SIMDのAVX512演算ユニットが多数搭載されており、高バンド幅メモリ MCDRAMと組み合わせることにより効率の高いDNN処理が実現できる。OFPでは 96GBのメモリを搭載したKNL計算ノードを数千ノード規模で、加えて強力な ストレージシステムを組み合わせることで、超大規模なDNN学習環境が構築できる。 本講演では、DLフレームワークとして広く使われているChainerのマルチノー ド実装であるChainer MN、またKerasとTensorflowの組み合わせによる、 超大規模DL学習環境構築について紹介する。 医用画像処理に適用した事例についても併せて紹介する。