- 著者
-
松本 幸
安達 知也
田中 稔
住元 真司
曽我 武史
南里 豪志
宇野 篤也
黒川 原佳
庄司 文由
横川 三津夫
- 雑誌
- 研究報告計算機アーキテクチャ(ARC)
- 巻号頁・発行日
- vol.2011-ARC-197, no.6, pp.1-10, 2011-11-21
本報告では,8 万台以上のノードを直接網で結合した 「京」 における MPI 集団通信の高速化について述べる.従来の MPI 集団通信アルゴリズムは,間接網向けのアルゴリズムが主体であり,これを直接網に適用してもメッセージの衝突のため効率的な通信ができない.このため,高い通信性能を得るためには直接網を意識した集団通信アルゴリズムが必須となる.そこで我々は,トーラス向け Allreduce アルゴリズム Trinaryx3 Allreduce を設計し,「京」 向けの MPI ライブラリに実装した.Trinaryx3 Allreduce は,「京」 の特長である複数 RDMA エンジンを同時に活用することができる.実装を評価した結果,既存の間接網向けアルゴリズムと比較して,5 倍程度バンド幅が向上することを確認した.