著者
今出 広明 平本 新哉 三浦 健一 住元 真司 黒川 原佳 横川 三津夫 渡邊 貞
雑誌
ハイパフォーマンスコンピューティングと計算科学シンポジウム論文集
巻号頁・発行日
vol.2012, pp.93-100, 2012-01-17

本論文では,RMATT(Rank Map Automatic Tuning Tool) における実行時間の高速化について述べる.RMATT は MPI アプリケーションにおけるランク配置を最適化することで通信処理時間を短縮することができるが,実行に長時間を要することが問題であった.この問題を解決するため,変更されたランクの通信処理のみを再計算する他,通信しないランク間のテーブル作成を省くことで計算量を大幅に削減する方法を開発した.評価の結果,4,096 ランクの Allgather bruck アルゴリズムの最適化に従来 16 時間かかっていた実行時間を 7.4 分に短縮できることを確認した.また,NAS Parallel Benchmark におけるクラス B,プロセス数 1,024 の CG に本 RMATT を適用し,京コンピュータ上において CG の実行時間を 7% 削減することを確認した.