- 著者
-
小郷 絢子
田邊 昇
高田 雅美
城 和貴
- 雑誌
- 研究報告ハイパフォーマンスコンピューティング(HPC)
- 巻号頁・発行日
- vol.2011, no.15, pp.1-10, 2011-07-20
本報告では,係数行列や解ベクトルが GPU 上に載りきらないほど大きな連立一次方程式を共役勾配法 (CG法) で解く際に,メモリアクセラレータの利用を提案する.提案アクセラレータは GDDR5 ポートなどに接続され,デバイスメモリの厳しい容量制約を緩和するとともに,Gather 機能によりキャッシュや GDDR 系メモリが苦手とする間接アクセスを連続アクセス化する.本報告では,フロリダ大学の疎行列コレクションを用いて提案方式の性能評価を行った.その結果,テクスチャキャッシュが効くような小さな行列でも,単体性能はテクスチャキャッシュを用いる既存手法の 1.05~2.01 倍に向上した.従来手法は行列サイズを大きくした時,GPU 内キャッシュのヒット率が低下し,性能低下する.解ベクトルがデバイスメモリ容量を超えると PCI express を通過する通信により,さらなる性能低下が予想される.それに対し,本手法はそれらの心配が無い.In this paper, we propose the use of memory accelerator to solve systems of liner equation, which coefficient matrices and solution vector unable to be had on board by CG method. In the case of existing method, when the size of matrix is increase, performance decrease because of hit probability on GPU cache decrease. We predict that performance decrease because of access of exceed access, the case solution vector is over device memory capacity. In contrast, there is no risk, thanks to this method. Proposed accelerator is connected to such as GDDR5 port, it ease severe capacity limit, and make indirect access which is unsuitable for cache and GDDR memory into direct access using gather function. In this paper, we evaluate the performance of proposed strategy with University of Florida Sparse Matrix Collection. The result showed from the 1.05 to the 2.01 times acceleration over the case of existing performance record with the texture cache, even if small matrix which has effect of texture cache.