著者
奥乃 博 京田耕司 中臺 一博 北野 宏明
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告ハイパフォーマンスコンピューティング(HPC)
巻号頁・発行日
vol.2000, no.23, pp.116-124, 2000-03-02

Beowulrクラスクラスタは,PCクラスタの論理構成法であり,コモディティハードウェアやソフトウェアによりPCクラスタが容易に構築できる.しかし,それらの組合せによってはうまく動かなかったり,あるいは,性能が全く出ないということがある.本稿では,Beowulfクラスクラスタのチューニングを(1)ネットワーク,(2)プロセッサ間通信ライブラリ(MPIやPVM),(3)応用プログラム,という3つのレベルで分けて,行うことを提案する.具体的には,NetPIPEというネットワーク測定用ツールを用いて,(1)と(2)をチューニングする.次に,線形代数でよく使われるLINPACKの一つScaLAPACKを応用プログラムとして利用し,(1)と(2)から得られたネットワーク特性を用いて,ScaLAPACKのチューニングを行う.とくに,小さな行列に分割することと,最適化された線形代数パッケージを使用することが,ScaLAPACKの性能向上に不可欠であることが判明した.これらの知見を利用することにより,Pentium-II 450 MHz,256 MByteメモリのノード32台で構成されるERATO-1に本手法を適用した結果,ハードウェアの不具合いが発見でき,また,LINPACKベンチマークで6.76GFlopsの性能が得られた.Beowulf-Class cluster is a logical organization of PC clusters composed of mass-market off-the-shelf hardware and software. The user may have problems that their implementation won't work well in hardware level or their implementation provides quite a poor performance. In this paper, we present a new method to tune and evaluation of the Beowulf-Class cluter by focusing on three levels: (1) network level, (2) message passing system level (e.g., MPI, PVM), and (3) application level. The first two performance is measured by NetPIPE developed by Ames Lab. ScaLAPACK (parallel version of LINPACK) is used as benchmarks for application programs, because it is one of the most common linear algebra subprograms and its evaluation is beneficial for numerical computation users. ScaLAPACK is tuned by using parameters determined by NetPIPE. ERATO-1 Beowulf-class cluster, 32 nodes of Pentium-II 450HHz processor with 256MByte of memory, is tuned by the proposed method. First, a network interface card installed in each ERATO-1 node is indentified as the cause of poor performance and finally ERATO-1 attained 6.76 GFlops with LINPACK benchmark.