著者
河合 直聡 三木 洋平 星野 哲也 塙 敏博 中島 研吾
雑誌
研究報告ハイパフォーマンスコンピューティング(HPC) (ISSN:21888841)
巻号頁・発行日
vol.2022-HPC-183, no.18, pp.1-9, 2022-03-10

限られた電力,設置面積で最大の性能を得られるスーパーコンピュータシステムを実現するためには,GPU 等の演算加速装置の導入が不可避となりつつある.汎用 CPU 向けに Fortran や C/C++ で記述され,OpenMP で並列化されたプログラムを CUDA 等を使って GPU 向けに書き直すことはコストがかかる.OpenMP にはバージョン 4.0 以降は GPU 等でプログラムを実行するオフローディング機能がサポートされている.本研究では,この機能を用いて,演算律速なアプリケーションである N 体計算およびメモリ律速なアプリケーションである ICCG 反復法に適用し,NVIDIA A100,AMD MI100 上での性能評価を実施した.結果,N 体計算では A100 上では CUDA 実装の 58.3%,MI100 上では HIP 実装の 71.9% の演算性能を確認した.また,ICCG 法では Stream Triad ベンチマークで計測したメモリースループットの 88%(A100)と 53%(MI100)を確認した.以上の結果から,OpenMP での GPU オフローディングは,MI100 上での ICCG 法を除いて,実用的な範囲と考える.
著者
塙 敏博 伊田 明弘 大島 聡史 河合 直聡
雑誌
研究報告ハイパフォーマンスコンピューティング(HPC) (ISSN:21888841)
巻号頁・発行日
vol.2016-HPC-155, no.40, pp.1-9, 2016-08-01

近年,FPGA (Field Programmable Gate Array) に対して新たな高性能計算向けのハードウェアとして注目が集まっている.FPGA は対象とする処理に合わせた最適な回路構成を用いることで高い性能や高い電力あたり性能を得られる可能性がある.さらに OpenCL を用いてプログラムコードの形で記述するだけで,FPGA 上のハードウェアとして容易に実現が可能な環境が整ってきた.本研究では,階層型行列における行列ベクトル積演算を対象に,FPGA 上に実装を行う.階層型行列は,小さな密行列と低ランク近似行列から構成される.階層型行列ベクトル積を行うには,これら構成行列に依存して入り組んだ処理が必要となる.このような問題に対して OpenCL を用いて FPGA 向けの実装を行い,コードの最適化方法と性能について比較する.