著者
椋木 大地 今村 俊幸
出版者
一般社団法人情報処理学会
雑誌
研究報告ハイパフォーマンスコンピューティング(HPC)
巻号頁・発行日
vol.2014, no.26, pp.1-6, 2014-12-02

NVIDIA が 2014 年にリリースした Maxwell アーキテクチャの GM107・GM204 コア搭載 GPU は,浮動小数点演算の理論ピーク演算性能比が倍精度:単精度 =1:32 である.このような環境ではソフトウェアで実装した疑似倍精度演算を用いた方が,倍精度の計算を高速に行える可能性がある.本稿では GM204 コアを搭載する GeForce GTX 980 を対象に,単精度型を 2 個連結して倍精度型を表現し,単精度演算で疑似的な倍精度演算を実現する double-float 演算 (DF 演算) を用いて,倍精度行列積を計算する BLAS ルーチンである DGEMM を実装した.その結果,ハードウェアの倍精度演算による通常の DGEMM と比べて,DF 演算を用いた DGEMM は約 2 倍の性能が得られた.

言及状況

Twitter (7 users, 7 posts, 0 favorites)

CiNii 論文 -  MaxwellアーキテクチャGPUにおける疑似倍精度演算を用いたDGEMMの実装と評価 https://t.co/Hyv4xHmGaJ #CiNii SWの擬似倍精度で単精度比1/32の倍精度HWの倍にはなるらしい(それでも1/16だもんなぁ・・・)。
「Maxwell の倍精度演算の低さをソフトウェアで実装した擬似倍精度でどうにかしようとやってみた」な論文を見つけてしまった #GPGPU http://t.co/1nCWsXUiiC MaxwellアーキテクチャGPUにおける疑似倍精度演算を用いたDGEMMの実装と評価

収集済み URL リスト