著者
坂本真貴人 藤井昭宏 田中輝雄
雑誌
研究報告ハイパフォーマンスコンピューティング(HPC)
巻号頁・発行日
vol.2013-HPC-138, no.6, pp.1-7, 2013-02-14

行列行列積を計算する DGEMM の性能は,さまざまな科学技術計算において重要である.DGEMM の高速化の手法の 1 つに Strassen のアルゴリズムがある.これは再帰的アルゴリズムであり,適用する回数を増やすことで計算量を O(N3) から O(Nlog7) まで削減することができる.しかし,計算機や行列サイズに合わせた適切な回数を選択しないと高速化できない.本研究では,Strassen のアルゴリズムを,自動チューニング機能付きの線形代数ライブラリである ATLAS をベースにして組み合わせた.そして,最適な適用回数を自動的に選択する機能をもつ行列行列積計算ライブラリを試作し,計算性能の評価を行った.実験の結果,さまざまな行列サイズで ATLAS 単体より高い性能を引き出すことができた.また,通常の方法に比べて誤差がどの程度になるか確認した.
著者
佐藤真之介 菱沼利彰 藤井昭宏 田中輝雄
雑誌
第76回全国大会講演論文集
巻号頁・発行日
vol.2014, no.1, pp.215-216, 2014-03-11

大規模な疎行列を扱う数値計算において,疎行列のデータ格納形式の一つとして圧縮行格納形式(CRS)が用いられている.疎行列の形状によっては,CRSのデータ構造をブロック化して保持するブロック圧縮行格納形式(BCRS)に変換し扱うことにより,行列計算を高速化することができる.本研究では,標準ベンチマークであるフロリダコレクションの有用なすべての疎行列に対して,AVXを用いてBCRSの疎行列ベクトル積の計測を行い,性能を決定するパラメタについて分析を行うことにより,AVXで行うBCRSの効果を示した.また,AVXを用いたBCRSの疎行列ベクトル積の性能は,CRSの疎行列ベクトル積の性能と比較して,全体で70%高速化でき,高速化したときの倍率は平均1.1倍であった.