著者
田村遼也 今村俊幸 仲谷栄伸
雑誌
研究報告ハイパフォーマンスコンピューティング(HPC)
巻号頁・発行日
vol.2014-HPC-143, no.21, pp.1-7, 2014-02-24

近年提唱されている,特に縦長行列 (m×n かつ m≫n) の QR 分解アルゴリズム Tall Skinny QR(TSQR) は階層的な構造による高並列性と通信最適性により極めて注目が集まっている解法である.本研究では GPGPU による TSQR の実装の中でも,CPU 資源を極力使わず,主たる計算部分を GPU に担当させる完全オフロード実装に関する研究を進めた.現時点では TSQR のフルバリエーションは未完成ではあるが,上三角行列Rの集約計算を限定したものの完全オフロード化に成功している.既存の GPU 数値計算ライブラリの代表格である MAGMA と比較しても,高速化するケースがあり,TSQR の並列性と GPU の高い処理能力が立証されたといえる.