著者
青木 秀貴 處 雅尋 本川 敬子 五百木 伸洋 齋藤 拡二
雑誌
情報処理学会研究報告計算機アーキテクチャ(ARC)
巻号頁・発行日
vol.2004, no.80(2004-ARC-159), pp.109-114, 2004-07-31

SR11000モデルH1が採用するPOWER4+はハードウェアによるデータプリフェッチをサポートするが,多数のロードストリームを含むループでは,ハードウェアですべてのストリームをプリフェッチすることができず,性能が低下する。本稿では,この問題を解消するソフトウェアプリフェッチ手法について紹介する。評価の結果,本手法の適用により,ストリーム数が増えた場合にも安定して高い性能を実現できることを確認し,ストリーム数を考慮したループ分割が不要なことを明らかにした。SR11000モデルH1向けの日立最適化FORTRAN90コンパイラは,本手法によるコード生成が可能である。