高速フーリエ変換(Fast Fourier Transform,以下FFT)は,科学技術計算において今日広く用いられているアルゴリズムである. 本発表では,Oakforest-PACSにおける並列FFTの自動チューニング手法について紹介する. 並列FFTにおいては,全対全通信が実行時間の多くを占めることが知られているが, 演算と通信をオーバーラップさせることにより,通信時間を隠蔽することが有効である. またデータの再利用性を高めるためにキャッシュブロッキングも有効である. これらの最適化手法に関するさまざまなパラメータに対して自動チューニングを適用した事例について述べる. またOakforest-PACSにおける性能評価の結果についても報告する.