著者
田中雄一郎 笹河良介 佐藤真平 吉瀬謙二
雑誌
研究報告組込みシステム(EMB)
巻号頁・発行日
vol.2013-EMB-28, no.26, pp.1-6, 2013-03-06

近年では,ソフトプロセッサがFPGAを使用するシステムにおいて一般的なコンポーネントとなっており,制御やデータ処理などの幅広い機能を実現するために使用されている.小型デバイスにおいてハードウェア容量は限られており,多機能・高性能化においてその容量制限が障害となる.ゆえに,小さいソフトプロセッサの開発が重要である.このようなソフトプロセッサの既存研究に,Supersmall Soft Processorが存在する.本研究ではSupersmall Soft Processorを元に使用面積の削減,並びに性能向上を目指すUltrasmall Soft Processorを提案する.Supersmall Soft Processorに対し,主要データパスの2ビット化,状態遷移の最適化,マルチプレクサの入力ロジックを含む最適化を施す.その結果,Virtex-7においてハードウェア量の削減を達成し,1.88倍のIPCを実現した.また,Ultrasmall Soft Processorの応用としてメニーコア化を検討する.
著者
宗形 敦樹 佐藤 真平 中原 啓貴
雑誌
研究報告システムとLSIの設計技術(SLDM) (ISSN:21888639)
巻号頁・発行日
vol.2019-SLDM-186, no.4, pp.1-6, 2019-01-23

画像認識の分野で広く利用されている畳込みニューラルネットワーク (CNN : Convolutional Neural Network) は重みの数や乗算数が多いという問題がある.これらを解決するため,本論文では雑音付加と point-wise (1 x 1) 畳込みを組み合わせた雑音畳込み層を用いる.既存研究の解析から,雑音畳込み層だけでは入力データは偏っているため認識精度が低下することが判明している.本論文では,k 層までを既存の畳込み層で実現し,k +1 層以降を雑音畳込み層で実現する Noise Convolutional Neural Network (NCNN) を提案する.これにより,大部分の畳込み層を 1 x 1 畳込み層に換えることで重みの数と乗算数を削減しつつ,雑音を加えることで認識精度劣化を抑えることができる.NCNN と既存 CNN の認識精度とパラメータ (重み) 量の比較を行った.CIFAR-100 データセットに関して,AlexNet ではパラメータを 88%,ResNet - 18 では 96.2% 削減できた一方,認識精度に関しては AlexNet では 2.2%,ResNet - 18 では 1.8% に抑えることができた.また,本論文では提案する NCNN を効率よく実行するアーキテクチャについて述べる.NCNN では k + 1 層以降は point-wise 畳込みのみ行われるため,複雑なメモリアクセスアーキテクチャは不要であり,単純かつ高速なアーキテクチャで実現可能である.提案 NCNN を Xilinx 社 ZCU102 FPGA 評価ボード上に実装した結果,クラス分類タスクに関しては Binary CNN と比較して同程度の速度を達成しつつ,認識精度が約 10% 優れていた.
著者
佐野 伸太郎 佐野 正浩 佐藤 真平 三好 健文 吉瀬 謙二
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. CPSY, コンピュータシステム (ISSN:09135685)
巻号頁・発行日
vol.109, no.296, pp.31-36, 2009-11-13
参考文献数
10

プロセッサに搭載されるコア数が増加したメニーコアアーキテクチャでは,プログラム中の並列性を活用することで,その演算性能を引き出すことが重要になる.我々が評価したところ,メニーコアアーキテクチャでは,並列化したタスクのコアへの配置方法が性能に影響を与えることがわかった.しかし,プログラマが最適な並列化タスクのコアへの配置(タスク配置)を記述することが困難であるため,コンパイラなどのツールによって最適なタスク配置を与えることが望まれる.本稿では,タスク配置を最適化する手法の確立を最終目的として,実行時間とタスク配置の関係性について評価する.まず配置をランダムに決定した場合の実行時間を求め,次に各配置を特徴づけるパラメタである通信量や通信路における衝突などとの関係性について考察する.