著者
渡邊 幸之介 大塚 智宏 天野 英晴
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌コンピューティングシステム(ACS) (ISSN:18827829)
巻号頁・発行日
vol.45, no.11, pp.393-407, 2004-10-15
被引用文献数
3

乗っ取り機構は新しい形態のハードウェア/ソフトウェア協調処理である.乗っ取り機構では,オンチッププロセッサがハードウェアのステートや内部レジスタを任意に書き換えることで,ハードウェア処理の一部をソフトウェア処理に置き換えることや,逆にソフトウェア処理の一部をハードウェアモジュールの機能を用いて高速化することが可能となる.我々は,この乗っ取り機構をRHiNETのネットワークインタフェース用コントローラチップであるMartiniに実装し,その有効性について評価を行った.評価の結果,乗っ取り機構を実装することで数%程度回路規模が増大するものの,効率的な例外処理が可能となるうえ,ソフトウェア通信処理の大幅な高速化が実現できることが分かった."Taking over mechanism" is a novel framework for a hardware/software cooperation. In this mechanism, an on-chip processor partly emulates a certain operation of hardwired logic, or uses a hardware module as an accelerator during software operation by stopping a state machine and accessing to registers of the module. We implemented this mechanism on Martini: a network interface controller chip of RHiNET. Evaluation results show that the taking over mechanism makes exception handling efficient, and moreover, it greatly accelerates software communication processing with a few percent of hardware increase.
著者
今田 啓介 酒井 洋介 大塚 智宏 鈴木 順 樋口 淳一 飛鷹 洋一 天野 英晴
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告計算機アーキテクチャ(ARC) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.75, pp.163-168, 2008-07-29

NEC により開発が進んでいる ExpEther は,PCI Express と Ethernet を統合するネットワークインタフェースである.本稿では,ExpEther を対象とする RDMA 通信機構を実装したネットワークインタフェースコントローラを利用するためのソフトウェア環境が RDMA 通信機構の性能に与える影響についての評価を述べる.実験用システムにおいて,RDMA 通信に必要な通信用バッファの Physical Buffer List (PBL) の取得に要する時間を測定した結果,1MByte の領域に対して 8.35μsec で済み,同じ領域に対するピンダウン処理の時間の半分程度であり,十分実用的であることがわかった.また PCI Express NIC に対するメモリアクセスをユーザレペルで行った場合のメモリアクセスレイテンシは 0.58μsec であり,カーネルを経由した場合と比べて 54.3% 削減できることを確認した.ExpEther by NEC is a network interface for a bridge between PCI Express and Ethernet for network connected virtual computer environment. In this paper, evaluation of the software environment which supports access to ExpEther network interface card (NIC) is described. On our experimental system, it takes 8.35μsec to get Physical Buffer List (PBL) for RDMA data transfer using 1MByte buffer. It is almost a half of time for pin-down the same memory area, and practical. The user-level memory access latency was 0.58μsec, and the overhead of using the kernel corresponding to 54.3% of execution time is removed.