MaxwellアーキテクチャGPUにおける疑似倍精度演算を用いたDGEMMの実装と評価

3 0 0 0 OA MaxwellアーキテクチャGPUにおける疑似倍精度演算を用いたDGEMMの実装と評価

著者: 椋木大地今村俊幸
雑誌: 研究報告ハイパフォーマンスコンピューティング(HPC)
巻号頁・発行日: vol.2014-HPC-147, no.26, pp.1-6, 2014-12-02

NVIDIA が 2014 年にリリースした Maxwell アーキテクチャの GM107・GM204 コア搭載 GPU は,浮動小数点演算の理論ピーク演算性能比が倍精度:単精度 =1:32 である.このような環境ではソフトウェアで実装した疑似倍精度演算を用いた方が,倍精度の計算を高速に行える可能性がある.本稿では GM204 コアを搭載する GeForce GTX 980 を対象に,単精度型を 2 個連結して倍精度型を表現し,単精度演算で疑似的な倍精度演算を実現する double-float 演算 (DF 演算) を用いて,倍精度行列積を計算する BLAS ルーチンである DGEMM を実装した.その結果,ハードウェアの倍精度演算による通常の DGEMM と比べて,DF 演算を用いた DGEMM は約 2 倍の性能が得られた.

2020-06-06 18:28:42
1 レファ協
2 + 0 Twitter

http://id.nii.ac.jp/1001/00107301/

言及状況

レファレンス協同データベース (1 libraries, 1 posts)

国立国会図書館は下記の文献を所蔵していますか。また、所蔵していない場合は所蔵機関を紹介してください。 MaxwellアーキテクチャGPUにおける疑似倍精度演算を用いたDGEMMの実装と評価椋木大地，今村俊幸 2014-HPC-147(26)　1-6 情報処理学会研究報告. HPC, [ハイパフォーマンスコンピューティング研究報告] / 情報処理学会 [編] ISSN=09196072

Twitter (2 users, 2 posts, 0 favorites)

https://t.co/m61dobfn3g どうやらglslの過剰精度演算は制御できないっぽいので他の方法を模索。 https://t.co/0hvss10TKA C++は問題なさそうだけどglslでの検証は晩飯の後（汗

これを使って誤差をマシにできるかな？ Maxwell アーキテクチャ GPU における疑似倍精度演算を用いた DGEMM の実装と評価 https://t.co/HPxhhkfKuV

3 0 0 0 OA MaxwellアーキテクチャGPUにおける疑似倍精度演算を用いたDGEMMの実装と評価

言及状況

レファレンス協同データベース (1 libraries, 1 posts)

Twitter (2 users, 2 posts, 0 favorites)

収集済み URL リスト