著者
Tongsheng GENG Leibo LIU Shouyi YIN Min ZHU Shaojun WEI
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
IEICE TRANSACTIONS on Information and Systems (ISSN:09168532)
巻号頁・発行日
vol.E93-D, no.12, pp.3223-3231, 2010-12-01
被引用文献数
6

This paper proposes approaches to perform HW/SW (Hardware/Software) partition and parallelization of computing-intensive tasks of the H.264 HiP (High Profile) decoding algorithm on an embedded coarse-grained reconfigurable multimedia system, called REMUS (REconfigurable MUltimedia System). Several techniques, such as MB (Macro-Block) based parallelization, unfixed sub-block operation etc., are utilized to speed up the decoding process, satisfying the requirements of real-time and high quality H.264 applications. Tests show that the execution performance of MC (Motion Compensation), deblocking, and IDCT-IQ (Inverse Discrete Cosine Transform-Inverse Quantization) on REMUS is improved by 60%, 73%, 88.5% in the typical case and 60%, 69%, 88.5% in the worst case, respectively compared with that on XPP PACT (a commercial reconfigurable processor). Compared with ASIC solutions, the performance of MC is improved by 70%, 74% in the typical and in the worst case, respectively, while those of Deblocking remain the same. As for IDCT_IQ, the performance is improved by 17% no matter in the typical or worst case. Relying on the proposed techniques, 1080p@30 fps of H.264 HiP@ Level 4 decoding could be achieved on REMUS when utilizing a 200 MHz working frequency.
著者
Xiaomin JIA Pingjing LU Caixia SUN Minxuan ZHANG
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
IEICE TRANSACTIONS on Information and Systems (ISSN:09168532)
巻号頁・発行日
vol.E93-D, no.12, pp.3211-3222, 2010-12-01

Chip Multi-Processors (CMPs) emerge as a mainstream architectural design alternative for high performance parallel and distributed computing. Last Level Cache (LLC) management is critical to CMPs because off-chip accesses often require a long latency. Due to its short access latency, well performance isolation and easy scalability, private cache is an attractive design alternative for LLC of CMPs. This paper proposes program Behavior Identification-based Cache Sharing (BICS) for LLC management. BICS is based on a private cache organization for the shorter access latency. Meanwhile, BICS tries to simulate a shared cache organization by allowing evicted blocks of one private LLC to be saved at peer LLCs. This technique is called spilling. BICS identifies cache behavior types of applications at runtime. When a cache block is evicted from a private LLC, cache behavior characteristics of the local application are evaluated so as to determine whether the block is to be spilled. Spilled blocks are allowed to replace some valid blocks of the peer LLCs as long as the interference is within a reasonable level. Experimental results using a full system CMP simulator show that BICS improves the overall throughput by as much as 14.5%, 12.6%, 11.0% and 11.7% (on average 8.8%, 4.8%, 4.0% and 6.8%) over private cache, shared cache, Utility-based Cache Partitioning (UCP) scheme and the baseline spilling-based organization Cooperative Caching (CC) respectively on a 4-core CMP for SPEC CPU2006 benchmarks.
著者
Min ZHU Leibo LIU Shouyi YIN Chongyong YIN Shaojun WEI
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
IEICE TRANSACTIONS on Information and Systems (ISSN:09168532)
巻号頁・発行日
vol.E93-D, no.12, pp.3202-3210, 2010-12-01
被引用文献数
11

This paper introduces a cycle-accurate Simulator for a dynamically REconfigurable MUlti-media System, called SimREMUS. SimREMUS can either be used at transaction-level, which allows the modeling and simulation of higher-level hardware and embedded software, or at register transfer level, if the dynamic system behavior is desired to be observed at signal level. Trade-offs among a set of criteria that are frequently used to characterize the design of a reconfigurable computing system, such as granularity, programmability, configurability as well as architecture of processing elements and route modules etc., can be quickly evaluated. Moreover, a complete tool chain for SimREMUS, including compiler and debugger, is developed. SimREMUS could simulate 270 k cycles per second for million gates SoC (System-on-a-Chip) and produced one H.264 1080p frame in 15 minutes, which might cost days on VCS (platform: CPU: E5200@ 2.5 Ghz, RAM: 2.0 GB). Simulation showed that 1080p@30 fps of H.264 High Profile@ Level 4 can be achieved when exploiting a 200 MHz working frequency on the VLSI architecture of REMUS.
著者
杉田 泰則 吉川 敏則 相川 直幸
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 A (ISSN:09135707)
巻号頁・発行日
vol.J93-A, no.12, pp.795-804, 2010-12-01

ディジタル信号処理の分野において,処理目的に応じてリアルタイムでフィルタ特性を変化させたいことがある.この要求を満たすために,使用時に周波数特性を容易に変えられる可変ディジタルフィルタに関する研究が近年盛んに行われている.本論文では,阻止域において部分的に大きい減衰量を複数もち,かつ,それら大きな減衰の領域がそれぞれ可変な低遅延FIRディジタルフィルタの設計法を提案する.提案法では,重み付き最小二乗法を用い,重み関数を更新して最小二乗問題を繰り返し解くことで準等リプル特性を得る.
著者
峰村 今朝明 後藤 理 東山 三樹夫 白井 克彦
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 A (ISSN:09135707)
巻号頁・発行日
vol.J93-A, no.12, pp.833-834, 2010-12-01

単母音スペクトルのz変換表示からべき級数展開表現への拡張を検討した.単母音スペクトルはべき級数展開において周波数幅約120 (Hz)ごとに基点を置いた6次関数で表現できる.更にべき級数展開表現を用いた多項式の零点分布により,話者の違いを確認した.
著者
二宮 洋
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 A (ISSN:09135707)
巻号頁・発行日
vol.J93-A, no.12, pp.828-832, 2010-12-01

本研究では準ニュートン法に基づくニューラルネットワークの新たな学習法を提案する.従来,準ニュートン法はこう配法に基づく強力な収束特性をもつバッチ学習法であった.近年,大規模なデータを扱う問題への応用としてオンライン準ニュートン法が提案された.本研究ではオンライン準ニュートン法の学習データの与え方を改良することで,準ニュートン法の収束特性を向上させた学習法を提案する.
著者
服部 一郎 熊谷 佳紀 大橋 剛介
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J93-D, no.12, pp.2678-2682, 2010-12-01

スケッチ画像検索において入力スケッチの各曲線情報とデータベースのエッジの各曲線情報をフーリエ記述子により記述し,データベース画像内に含まれるオブジェクトの部分検索を可能にする手法を提案する.
著者
佐野 徹 加東 勝 齊藤 貴樹 天野 英晴
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J93-D, no.12, pp.2579-2586, 2010-12-01

動的リコンフィギャラブルプロセッサにおいて,構成情報転送と実行のオーバラップができない際に,データ転送用の結合網を構成情報の転送に転用することで,構成情報転送時間を削減する手法,データバスコンフィギュレーションを提案する.動的リコンフィギャラブルプロセッサMuCCRA-3.32bを対象として,実際に設計及びシミュレーションを行った結果,データバスコンフィギュレーションの適用によってわずか1.3%のハードウェアオーバヘッドで,構成情報の転送時間を半分近くにすることができることが示された.f転送中の消費電力は増加するが,効率的な転送により消費エネルギーは2D-DCTの場合36%の削減が達成された.
著者
杉本 修 内藤 整 酒澤 茂之 羽鳥 好律
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J93-D, no.12, pp.2620-2632, 2010-12-01

Full Referenceフレームワークに基づくマルチメディアアプリケーション向けの知覚映像品質評価方式を提案する.本論文では,圧縮符号化による画質劣化に伴うユーザの知覚品質劣化の程度を七つの画像特徴量の重み付き和により定義された客観評価値により推定する.また,フレームレートに応じた客観評価値の補正を行うことにより,テレビ伝送用フォーマットのみを前提とした客観評価方式では対応できていなかった幅広い種類のアーチファクトをもつ低フレームレート画像に対する知覚映像品質の導出を可能としている.計算機シミュレーションにより提案方式の性能評価を行い,MPEG-4 part. 2及びH. 264/AVCエンコーダによりビットレート32 k~512 kbit/sで符号化した3~15 fpsのCIF,QCIF解像度の動画像の主観画質を相関0.88以上で推定可能であることを示す.また,上述のフレームレートに応じた客観評価値の補正により主観画質の推定精度を向上できること,及び7種の特徴量が等しく画質推定に寄与していることを示すことにより,提案方式が幅広い種類の映像に対応可能であることを示す.
著者
KITAMOTO Takuya YAMAGUCHI Tetsu
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
IEICE transactions on fundamentals of electronics, communications and computer sciences (ISSN:09168508)
巻号頁・発行日
vol.91, no.8, pp.2101-2110, 2008-08-01

Let <i>M</i>(<i>y</i>) be a matrix whose entries are polynomial in <i>y</i>, λ(<i>y</i>) and υ(<i>y</i>) be a set of eigenvalue and eigenvector of <i>M</i>(<i>y</i>). Then, λ(<i>y</i>) and υ(<i>y</i>) are algebraic functions of <i>y</i>, and λ(<i>y</i>) and υ(<i>y</i>) have their power, series expansions<br>λ(<i>y</i>)=β<sub>0</sub>+β<sub>1</sub><i>y</i>+…+β<sub><i>k</i></sub><i>y</i><sup><i>k</i></sup>+…(β<sub><i>j</i></sub>∈<b>C</b>), (1)<br>υ(<i>y</i>)=γ<sub>0</sub>+γ<sub>1</sub><i>y</i>+…+γ<sub><i>k</i></sub><i>y<sup>k</sup></i>+…(γ<sub><i>j</i></sub>∈<b>C</b><sup><i>n</i></sup>), (2)<br>provided that <i>y</i>=0 is not a singular point of λ(<i>y</i>) or υ(<i>y</i>). Several algorithms are already proposed to compute the above power series expansions using Newton's method (the algorithm in [4]) or the Hensel construction (the algorithm in [5], [12]). The algorithms proposed so far compute high degree coefficients, β<sub><i>k</i></sub> and γ<sub><i>k</i></sub>, using lower degree coefficien β<sub><i>j</i></sub> and γ<sub><i>j</i></sub>(<i>j</i>=0,1,…,<i>k</i>-1). Thus with floating point arithmetic, the numerical errors in the coefficients can accumulate as index <i>k</i> increases. This can cause serious deterioration of the numerical accuracy of high degree coefficients β<sub><i>k</i></sub> and γ<sub><i>k</i></sub>, and we need to check the accuracy. In this paper, we assume that given matrix <i>M</i>(<i>y</i>) does not have multiple eigenvalues at <i>y</i>=0 (this implies that <i>y</i>=0 is not singular point of γ(<i>y</i>) or υ(<i>y</i>)), and presents an algorithm to estimate the accuracy of the computed power series β<sub><i>i</i></sub>, γ<sub><i>j</i></sub> in (1) and (2). The estimation process employs the idea in [9] which computes a coefficient of a power series with Cauchy's integral formula and numerical integrations. We present an efficient implementation of the algorithm that utilizes Newton's method. We also present a modification of Newton's method to speed up the procedure, introducing tuning parameter <i>p</i>. Numerical experiments of the paper indicates that we can enhance the performance of the algorithm by 12-16%, choosing the optimal tuning parameter <i>p</i>.
著者
奥村 治彦 内田 龍男 金子 節夫 下平 美文 内池 平樹 服部 励治 中西 洋一郎 山崎 映一 中本 正幸
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 C (ISSN:13452827)
巻号頁・発行日
vol.J92-C, no.8, pp.433-453, 2009-08-01

2002年には,金額ベースでは,FPD全体の市場がCRT市場を超え,特に成長が著しくFPDの活躍の場である携帯電話を中心としたモバイル市場はもとより,最近になって,CRTの最大市場であるテレビ受像機市場でも逆転現象が発生するまでにFPD市場が急成長してきた.このような中,本論文では,中心的な役割を果たしてきたCRTと,その主役を引き継ぐFPD(LCD,PDP,EL,FEDに分類)について,ここ40年のそれぞれの技術進化を振り返り,将来を展望する.
著者
渡辺 重佳
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 C (ISSN:13452827)
巻号頁・発行日
vol.J92-C, no.8, pp.467-476, 2009-08-01

本論文では現在の半導体メモリ市場の主流製品であるDRAM,フラッシュメモリと今後の大きな市場が期待される FeRAM ,MRAM,PRAM, ReRAM 等の新型メモリの過去40年の歴史とその将来展望に関して述べる.DRAMではメモリセルの構造とメモリセルサイズの縮小が重要であり,その高速性のため,パソコンの主記憶等に使われる.マルチメディア情報の記憶媒体として使われるフラッシュメモリは不揮発性特性と低コスト技術が重要であり,低コスト化のため多値化,積層化が進められている.新型メモリは近い将来は各メモリ固有の研究開発状況に合わせた製品化が重要だが,将来はDRAMとフラッシュメモリの特性を併せ持つユニバーサルメモリの実現が期待される.
著者
榎本 忠儀
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 C (ISSN:13452827)
巻号頁・発行日
vol.J92-C, no.8, pp.477-487, 2009-08-01

動画像符号化プロセッサLSI(符号化LSI)が世界で初めて開発されたのは1987年であった.その後飛躍的な発展を遂げ,現在のディジタルマルチメディア時代が築かれた.本論文では,まず符号化LSI開発の歴史を振返る.次に符号化LSIの高速化・高性能化・低電力化を実現するために開発された各種技術を解説する.更に, MPEG-2 符号化LSI, MPEG-4 符号化LSIのチップアーキテクチャ,機能,特徴,H. 264/AVCのチップ応用を詳述する.最後に,将来に向けた符号化LSIの低電力化技術に言及し,符号化LSIの将来を展望する.
著者
密山 幸男 高橋 一真 今井 林太郎 橋本 昌宜 尾上 孝雄 白川 功
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 A (ISSN:09135707)
巻号頁・発行日
vol.J93-A, no.6, pp.397-413, 2010-06-01

面積効率の向上を目指したヘテロジニアス構造を有する粗粒度再構成可能アーキテクチャは,アプリケーション分野を特化することで高性能化と小面積化を実現することができる.そこで我々は,対象アプリケーションをメディア処理に特化したヘテロジニアス粗粒度再構成可能アーキテクチャARAMを開発してきた.本論文では,ARAMによって複数の動画像復号処理を実現できることを示すため,MPEG-2デコーダ,MPEG-4デコーダ,H. 263デコーダを設計対象として,各処理過程のマッピングについて述べる.更に,動画像復号処理の高性能化要求に対して,ARAMのスケーラビリティと動画像復号処理の画素並列性を用いた性能拡張について述べる.またフィルタバンクのマッピングについて述べ,動画像復号処理以外にも適用できる機能拡張性を示す.
著者
Mun-Kyu LEE Jeong Eun SONG Dooho CHOI Dong-Guk HAN
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
IEICE TRANSACTIONS on Fundamentals of Electronics, Communications and Computer Sciences (ISSN:09168508)
巻号頁・発行日
vol.E93-A, no.1, pp.153-163, 2010-01-01
被引用文献数
25

The NTRU cryptosystem is a public key system based on lattice problems. While its theoretical security has been well studied, little effort has been made to analyze its security against implementation attacks including power analysis attacks. In this paper, we show that a typical software implementation of NTRU is vulnerable to the simple power analysis and the correlation power analysis including a second-order power attack. We also present novel countermeasures to prevent these attacks, and perform experiments to estimate the performance overheads of our countermeasures. According to our experimental results, the overheads in required memory and execution time are only 8.17% and 9.56%, respectively, over a Tmote Sky equipped with an MSP430 processor.
著者
Shingo HASEGAWA Hiroyuki HATANAKA Shuji ISOBE Eisuke KOIZUMI Hiroki SHIZUYA
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
IEICE TRANSACTIONS on Fundamentals of Electronics, Communications and Computer Sciences (ISSN:09168508)
巻号頁・発行日
vol.E91-A, no.1, pp.330-337, 2008-01-01

This paper studies a method for transforming ordinary cryptographic primitives to new harder primitives. Such a method is expected to lead to general schemes that make present cryptosystems secure against the attack of quantum computers. We propose a general technique to construct a new function from an ordinary primitive function f with a help of another hard function g so that the resulting function is to be new hard primitives. We call this technique a lifting of f by g. We show that the lifted function is harder than original functions under some simple conditions.
著者
安田 宗樹 田中 和之
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J93-D, no.11, pp.2446-2453, 2010-11-01

ボルツマンマシンはマルコフ確率場の形式をとる確率的ニューラルネットワークの一つであり,パラメトリック機械学習の重要なモデルの一つである.しかしボルツマンマシンの厳密な学習アルゴリズムは一般にシステムの次元に対して指数的な計算コストを必要としてしまう.近年Hintonによりcontrastive divergenceと呼ばれる強力な近似学習アルゴリズムが提案され,多くの学習問題に適用されてきている.しかしながらcontrastive divergenceにはアルゴリズムの収束などに関しての理論的な保証がほとんどなく,実用的には確率的なサンプリング法を必要とするためアルゴリズムが分散をもってしまうという欠点がある.そこで本論文では相関等式と呼ばれる定式化を用いてボルツマンマシンに対する新しい近似学習アルゴリズムを提案する.提案学習アルゴリズムはボルツマンマシンの学習の問題を単純な凸最適化問題へと近似することにより得られる.そのアルゴリズムは観測データ点に対して決定論的に解を与えるものであるため実装には便利である.また提案学習アルゴリズムの性能はcontrastive divergenceやYasuda and Tanakaにより提案されたloopy belief propagationを用いた学習アルゴリズムの性能を多くの場合で上回ることを人工データに対する数値実験を用いて示す.
著者
藤田 和之 高嶋 和毅 築谷 喬之 朝日 元生 伊藤 雄一 北村 喜文 岸野 文郎
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J93-D, no.11, pp.2454-2465, 2010-11-01

ユーザによる単純な操作に複数のカメラ操作を連動させ,効率良く地図を閲覧することができるインタラクション手法としてAnchored Zoom (AZ)とAnchored Zoom and Tilt (AZT)の二つを提案する.二次元の地図を俯瞰する三次元的なカメラ視点を用い,AZではズームを,AZTではズームとチルトをパン操作に連動させ,ユーザの指定する地図上の1点を常にビューポートに収めるよう制御する.これら2手法のパフォーマンスを評価するため,ペン入力の環境において,従来手法であるPan & Zoom (PZ)及びSpeed-dependent Automatic Zooming (SDAZ)と比較する実験を行った.画面外オブジェクトの獲得タスクと位置把握タスクの二つを実施した結果,提案手法が従来手法に比べ距離感や方向感覚を失うことなく,より高速にオブジェクトを獲得できることが分かった.
著者
三留 綾 市毛 弘一 石井 六哉
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J89-D, no.6, pp.1369-1378, 2006-06-01

本論文では,人の直観性を伴った新たなユーザインタフェースとして,グローブやマーカ等の特殊な装置を必要としない簡単なハードウェア構成で手指形状を認識する手法を提案する.提案する認識手法は,手領域抽出部と手指形状認識部から構成される.手領域抽出部では,撮影する背景の制限を削減するために,背景がグレースケールの場合とカラーの場合の2パターンに分け,それぞれに対応したアルゴリズムにより手領域を抽出する.手指形状認識部では,抽出した手領域の画像を詳細に解析することにより,10種類の手指形状を認識する.入力する手の角度や腕の領域を制限せず,更に指同士が接している場合においても認識が可能になるようなアルゴリズムを提案する.提案手法により,背景がグレースケールの場合は10種類の手指形状を95.8%の精度で,背景がカラーの場合は同じく10種類の手指形状を93.3%の精度で認識している.また,これらの処理に要する時間は汎用コンピュータで数十 msであり,極めて短い時間であることを確認している.
著者
Babak Mohammadian Abdolreza Nabavi
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
IEICE Electronics Express (ISSN:13492543)
巻号頁・発行日
vol.7, no.19, pp.1453-1460, 2010 (Released:2010-10-10)
参考文献数
9
被引用文献数
1 1

A new wideband Orthogonal Frequency Division Multiplexing (OFDM) receiver based on split spectrum processing (SSP) technique is presented. In this receiver, the spectrum of the input signal is first decomposed into a number of sub-bands, and then independently down-converted to baseband for filtering and demodulation. This technique, which is characterized by the number of sub-bands and their bandwidths, reduces the sampling rate of analog-to-digital converter (ADC) by the sub-band bandwidth compared to conventional OFDM system. Analysis and simulation of the phase noise show that the new receiver exhibits the same bit error rate (BER) performance as the conventional OFDM system. Also, the Chebyshev II filter gives rise to superior BER performance compared to Butterworth, Chebyshev I, Elliptic, and Bessel filters. Interestingly, the traditional time domain synchronization algorithms can be employed for the new SSP receiver with only minor modifications.