著者
稲益 秀成 船井 遼太朗 中島 康彦
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J105-D, no.12, pp.725-735, 2022-12-01

我々が開発した,CPUの構造に基づくリニアアレー型CGRAは,汎用プロセッサ上でのアルゴリズムのデバッグが容易であること,配置・配線の探索空間が小さくコンパイルが高速であることが特徴である.そこで,これらの特徴を活かしたJust-in-Time実行環境を開発した.これにより,様々なPE数の環境において,最適なマッピングを動的に生成できる.代表的なDCNNの行列積と畳み込み誤差逆伝播処理を評価した結果,JITコンパイル時間はわずか1~3秒であった.そして,行列サイズ2048 × 2048の場合,実行環境全体の実行時間に対するJITコンパイル時間は1.3%~22.18%となり,データサイズが大きい場合やカーネルが再利用可能な場合は,JIT方式の実行環境による高速化を確認できた.
著者
須賀 圭一 山原 幹雄 中田 尚 中島 康彦
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告システムソフトウェアとオペレーティング・システム(OS) (ISSN:09196072)
巻号頁・発行日
vol.2007, no.83, pp.17-22, 2007-08-03
被引用文献数
2

近年,携帯情報機器に対しても高度なマルチメディア処理が要求されてきており,性能向上のために専用プロセッサが搭載されている.しかし,複数プロセッサの搭載は消費電力の増大を招くため,組み込み機器として用いる場合は問題になる.そこで我々は,既存のマルチスレッド実行を拡張して,複数アーキテクチャを同時実行する OROCHI プロセッサを提案している.ただし,本プロセッサを厳密に性能評価するためには OS の搭載が必要であり,入出力や主記憶など周辺機能を装備しなければならない.本論文では,異種命令セットを同時実行するプロセッサを想定し,OSが稼働する実験環境構築のために必要な検討課題と解決策について報告する. また,予備的評価として,クロックアキュレートなシミュレータを用いて OS を動作させ,ソフトウェア割り込みの処理形態に応じた挙動について評価を行った.Recently, mobile devices and embedded equipments are required to execute multimedia programs which have much IPL. Equipped with application specific processors, high performance can be achieved. However, this solution leads to power consumption problem. Thus we proposed a heterogeneous SMT processor OROCHI, which can support multiple instruction sets simultaneity. To estimate the processor performance under working OS code, we developed the experimental circumstance which has the peripheral, I/O and main memory.In this paper, we discuss the OS environment for an SMT processor executable with multiple instruction sets. As a consequence, we estimate cache performance under working OS code using clock accurate simulator.
著者
木村 睦 中島 康彦 ZHANG Renyuan 松田 時宜 羽賀 健一 徳光 永輔
出版者
奈良先端科学技術大学院大学
雑誌
基盤研究(C)
巻号頁・発行日
2019-04-01

人工知能は、未来の社会の中心となる技術であるが、巨大なサイズと膨大な電力が問題である。ニューロモーフィックシステムは、脳の模倣で、コンパクト化・低消費電力化が期待できる。そこで、我々は、超コンパクト・超低パワーの『リアルニューロモーフィックシステム』の研究を、アーキテクチャ:単一アナログデバイス/マテリアル : アモルファス金属酸化物半導体/アルゴリズム:局所的学習則の3つの観点から進めている。本研究では、上記の新技術を導入したニューロモーフィックシステムの動作を、シミュレーション・実機で確認し、実用的かつ人間の脳と同様な超コンパクト・低パワーの汎用人工知能の可能性を検討する。
著者
鈴木 郁真 池内 康樹 津邑公暁 中島 康彦 中島 浩
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌コンピューティングシステム(ACS) (ISSN:18827829)
巻号頁・発行日
vol.46, no.16, pp.129-143, 2005-12-15
被引用文献数
5

遺伝的アルゴリズムにおいて最も処理時間を要する適合度計算に対し,再利用を適用することで高速化する手法を提案し,再利用の有効性を示す.適合度計算の入力となる遺伝子が,前世代で処理された遺伝子と多くの共通部分を持つことから,適合度関数を分割することで再利用の効果を引き出す手法について述べる.GENEsYs を用いて評価した結果,2 点交叉で最大83%,平均27%のサイクル数を削減できた.さらに,関数分割などの改良を施すことにより,最大86%,平均38%までこれが向上した.特に適合度計算に要する時間が長い適合度関数について,再利用の効果がより大きくなることが分かった.This paper describes a speedup technique with computational reuse for the fitness calculation of GA programs. A genotype has many genes in common with its parental genotypes. Therefore, partial results of fitness calculation are reusable. Through the result of an evaluation with GENEsYs, a well-known GA software, we show that the maximum ratio of the cycle reduction reaches 83%, while accomplishing average reduction of 27% with 2-point crossover. Futhermore, dividing fitness procedures raises the maximum ratio to 86% and average ratio to 38%.