マルチFPGA上でのGoogLeNet実装

1 0 0 0 OA マルチFPGA上でのGoogLeNet実装

著者: 飯塚健介武者千嵯天野英晴
雑誌: 研究報告システム・アーキテクチャ(ARC) (ISSN:21888574)
巻号頁・発行日: vol.2018-ARC-230, no.33, pp.1-6, 2018-02-28

高精度な画像認識や,物体検出を実現する畳み込みニューラルネットワーク (CNN : Convolutional Neural Network) は一躍注目されている.CNN は認識精度向上を目指し様々なモデルが提案されているが,計算量が増加する傾向にあり,より効率的な演算処理が求められている.しかし,汎用プロセッサではその要求を満たすことが困難なため,専用のアクセラレータの需要が高まっている.日本でも国立研究開発法人新エネルギー・産業技術開発機構 (NEDO) が複数の FPGA,GPU,メモリなどの異種ノードを接続した大規模人工知能計算基盤 Flow-in-Clowd (FiC) を開発している.FPGA ノードは多数の高速リンクが接続され,FiC の高速通信のスイッチングを担う.FiC システムにおいて主演算を行うのは GPU ノードであるが,FPGA ノードもスイッチを実装した上で余った計算資源を利用して AI エンジンとしての役割を担うことができる.本研究ではマルチ FPGA システムに CNN モデルの 1 つであるGoogLeNet を実装し,評価することで GoogLeNet の高速化を図るとともに,マルチ FPGA システムの深層学習アクセラレータとしての活用ができるかを検討する.GoogLeNet が持つネットワークモデル特有の計算並列性,畳込み演算の計算並列性を利用したマルチFPGAシステムへの実装を行った結果,シミュレーション上で CPU の約 9.1 倍の高速化を達成した.

2018-02-28 22:05:52
1 + 0 Twitter

http://id.nii.ac.jp/1001/00186319/

言及状況

Twitter (1 users, 1 posts, 0 favorites)

"情報学広場：情報処理学会電子図書館" https://t.co/VyM3u5Rcbk ARCでもMLなんだなあ

収集済み URL リスト

https://ipsj.ixsq.nii.ac.jp/ej/?action=pages_view_main&active_action=repository_view_main_item_detail&item_id=186407&item_no=1&page_id=13&block_id=8 (1)