著者
河合 直聡 三木 洋平 星野 哲也 塙 敏博 中島 研吾
雑誌
研究報告ハイパフォーマンスコンピューティング(HPC) (ISSN:21888841)
巻号頁・発行日
vol.2022-HPC-183, no.18, pp.1-9, 2022-03-10

限られた電力,設置面積で最大の性能を得られるスーパーコンピュータシステムを実現するためには,GPU 等の演算加速装置の導入が不可避となりつつある.汎用 CPU 向けに Fortran や C/C++ で記述され,OpenMP で並列化されたプログラムを CUDA 等を使って GPU 向けに書き直すことはコストがかかる.OpenMP にはバージョン 4.0 以降は GPU 等でプログラムを実行するオフローディング機能がサポートされている.本研究では,この機能を用いて,演算律速なアプリケーションである N 体計算およびメモリ律速なアプリケーションである ICCG 反復法に適用し,NVIDIA A100,AMD MI100 上での性能評価を実施した.結果,N 体計算では A100 上では CUDA 実装の 58.3%,MI100 上では HIP 実装の 71.9% の演算性能を確認した.また,ICCG 法では Stream Triad ベンチマークで計測したメモリースループットの 88%(A100)と 53%(MI100)を確認した.以上の結果から,OpenMP での GPU オフローディングは,MI100 上での ICCG 法を除いて,実用的な範囲と考える.