著者
久保田 悠司 高橋 大介
出版者
情報処理学会
雑誌
研究報告ハイパフォーマンスコンピューティング(HPC) (ISSN:18840930)
巻号頁・発行日
vol.2010, no.19, pp.1-7, 2010-12-09

近年,科学技術計算の分野で GPGPU が注目されている.科学技術計算では,特に疎行列ベクトル積を用いることが多いため,疎行列ベクトル積の高速化が重要である.疎行列には多くの格納形式があるが,疎行列によって最適な格納形式は異なる.そこで,本研究では与えられた疎行列によって最適な格納形式に変換してから,疎行列ベクトル積を行うことで高速化を図る.まず予備実験として,いくつかの疎行列の格納形式について,疎行列ベクトル積を実装し,実行速度を測定した.その後,予備実験の結果をもとに自動選択するためのパラメータを決定し,自動選択アルゴリズムを実装する.また,実装したアルゴリズムを,反復法による連立一次方程式の求解を用いて評価した.その結果,多くの疎行列において最適な格納形式を選択し高速化することに成功した.Sparse matrix vector multiplication is one of the most often used functions in scientific and engineering computing.The storage schemes for sparse matrices have been proposed,however,each sparse matrices have an optimal storage scheme,In this paper,we propose an auto-tuning algorithm of sparse matrix vector multiplication by selecting storage schemes automatically on GPU,We evaluated our algorithm using Conjugate Gradient solver.As a result,we found that our algorithm was effective in many sparse matrices.

言及状況

Twitter (1 users, 1 posts, 0 favorites)

@ezra_brook_s 連立一次方程式の次元数にあわせて疎行列ベクトル積のブロック数とスレッド数を変化させるって感じですか?^^; 疎行列ベクトル積だけなら既にこの辺の論文でやられていたきが・・・ http://t.co/ClHycIdh

収集済み URL リスト