著者
安河内 真弓 下尾 浩正 山脇 彰 岩根 雅彦
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告計算機アーキテクチャ(ARC) (ISSN:09196072)
巻号頁・発行日
vol.2002, no.22, pp.91-96, 2002-03-07
参考文献数
5
被引用文献数
10

様々な応用処理に対して適切な回路構成をとることのできる再構成可能プロセッサMRPを提案する.MRPは,1回の回路構成で複数の機能処理回路を構成できる1プレーンマルチファンクション構成により実行回路の書き換え回数を削減し,大規模な回路に対しては1ファンクションマルチプレーン構成を採ることで対応している.MRPは,CPUコア,再構成部制御回路および複数の再構成部実行回路から成り,再構成部実行回路を動的に変更することでローディング時間を隠蔽することができる.予備実験として,1プレーンマルチファンクションを実現する個別部品構成の試作機486RCPを開発し,評価を行ったところ,フィボナッチ数列の第n項算出では最大30倍の性能向上が得られた.This paper presents the Micro Reconfigurable Processor (MRP) can be suitable circuit composition to the various application processing. MRP reduces the number of times of reconfiguration using Single Plane Multiple Function organization, which can constitute two or more functional processing circuits per circuit configuration. Single Function Multiple Plane organization is enable large circuits to be run on limited physical FPGA. MRP contains CPU core, control logic of reconfigurable part and some reconfigurable part, and the dynamic loading circuit reduces overhead for reconfiguration. We report the experiment model 486RCP, discrete parts composition, which developed for the purpose of realization of Single Plane Multiple Function organization. The experiment results show that 486RCP achieves speedup maximum 30 times on Calculation of Fibonacci numbers.
著者
早川 潔 関口 智嗣 岩根 雅彦
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告ハイパフォーマンスコンピューティング(HPC) (ISSN:09196072)
巻号頁・発行日
vol.2001, no.77, pp.111-116, 2001-07-25
被引用文献数
2

Beowulf クラスタシステムは 比較的安価でかつ容易に構築できるため 非常に注目を集めており Beowulf クラスタでの通信性能をはじめとする種々の処理性能向上に関する研究が盛んに行われている.また 処理性能の高精度な測定は より正確な評価を可能にし 通信時間の隠蔽などといった並列処理の効率化を可能にする.一般的に処理性能を測定するためには 各ノードの実行開始時刻を正確に揃えなければならない.一般的なBeowulf クラスタでは 各ノードの実行開始時刻を揃えるために MPI などの通信ライブラリのBarrier 関数が用いられる.しかし Beowulf クラスタに実装されるBarrier では ある程度の誤差が生じてしまう.そこで 本稿では PC をベースしたBeowulf クラスタシステ厶(SCCB-Cluster system )における高精度実行時間測定システムの検討を行った.高精度な測定を可能にするために Beowulf クラスタに高速なバリア同期を可能にするSCC ボードを搭載した.また そのSCC ボードの中にクロックカウンタを搭載し 疑似的なグローバルクロックを実装する.性能評価として Beowulf クラスタのcollective 通信性能を測定した.SCC ボードでの高速なバリア同期を用いた実行時間測定値は Ethernet を使用したMPI_Barrier を用いた測定値より 安 定し かつ 短い値を示したものあった.Beowulf cluster consisted of commodity parts,such as PCs and 100base/TX LAN card,is the most remarkable parallel computer system.Collective communications using MPI are the most integral packet forwarding methods on the cluster computing.Accurate performance analysis of collective communication is useful on performance evaluation and prediction of Beowulf cluster system.In order to measure execution time accurately, each node have to take the first step with execution by barrier.But it is difficult for each node to take the first step with execution each other,since it receives the packet indicating barrier completion through Ethernet (i.e.MPI_Barrier)in different time. This paper describes the Beowulf cluster system (SCCB cluster)that allows us to measure execution time accurately.SCC (Synchronization Communication Controller)was implemented in this cluster system.SCC is able to finish executing barrier less than 10us with 32 nodes.As the performance analysis of MPI collective communication using barrier that SCC performs (SCC_Barrier), performance of MPI collective communication of SCC_Barrier is less fluctuation than that of MPI_Barrier.