著者
平井 遥 入江 英嗣 五島 正裕 坂井 修一
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告計算機アーキテクチャ(ARC) (ISSN:09196072)
巻号頁・発行日
vol.2006, no.88, pp.43-48, 2006-07-31
被引用文献数
1

スーパスカラ・プロセッサの命令パイプラインにおいて、命令ウインドウより上流をフロントエンドと呼び、命令ウインドウおよびその下流をバックエンドと呼ぶ。従来のスーパスカラ・プロセッサでは演算器はバックエンドに配置され、命令の実行はバックエンドのみで行われる。これに対して我々はフロントエンド実行という手法を提案している。フロントエンド実行とはバックエンドに加えてフロントエンドにも演算器を配置し、実行可能な命令をフロントエンドでも実行することである。フロントエンド実行には従来のプロセッサに比べクリティカル・パス上の命令の実行間隔を狭める効果がある。本稿ではフロントエンド実行の考え方を押し進め、改良手法としてツインテール・アーキテクチャと呼ぶ手法を提案する。ツインテール・アーキテクチャはフロントエンド実行ステージを通常のパイプラインから独立させたものであり、これによってフロントエンド実行ステージによるパイプライン段数の増加はなくなる。この手法はフロントエンド実行において難点であった部分を改善してさらなる性能向上を図ることを目的とした手法である。The front end (or back end) of the pipeline in a superscalar processor refers to the pipeline before (or after) the instruction window. Traditionally, physical locations of ALUs, as well as instruction execution belong to the backend. We have proposed front end execution (FEE). In FEE, ALU allocation and instruction execution also take place in the front end. By early executing instructions with ready source operands, execution time of critical instructions can be reduced. This work proposes an enhanced FEE, called twintail architecture. In twintail architecture, the stages responsible for FEE are separated from the main pipeline. By which, the overheads previously caused by additional FEE stages can be removed.
著者
放地 宏佳 三好 健文 入江 英嗣 吉永 努
雑誌
研究報告ユビキタスコンピューティングシステム(UBI)
巻号頁・発行日
vol.2011, no.11, pp.1-8, 2011-11-17

スマートフォンや情報家電といったネットワーク接続可能なデバイスにより実世界の多種多様な場面で情報処理を活用できるようになった.それに伴って,多種多様な用途を対象としたアプリケーションが求められるようになっている.そこで,多様化するアプリケーションをユーザ自身が開発できるよう,プログラミングに慣れていないユーザであっても,自らのアプリケーションへの要求を自らで満たすことが可能なマッシュアップフレームワーク IDUMO を提案する.IDUMO フレームワークでは,マッシュアップに必要不可欠な機能である,(1) 統一的な入出力インタフェースの定義,(2) プログラム実行モデルの差異の吸収,(3) 容易な開発方法,を提供する.本論文では,IDUMO フレームワークの設計について述べ,アプリケーション開発のケーススタディにより有用性を示す.As smartphones and information appliances are widely used, we can employ information processing in all areas of day-to-day lives. Based on this, various applications are required for each of our activities. In order to make users to develop such required applications easily, a mashup framework IDUMO is proposed. IDUMO framework provides three features to support mashup; 1)unified interfaces for input/output data, 2)adaptability for various program execution models 3)friendly implementation method. In this paper, the design of IDUMO framework is described and the availability is shown by several case studies to implement application with the framework.
著者
亘理 靖展 堀尾 一生 入江 英嗣 五島 正裕 坂井 修一
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告計算機アーキテクチャ(ARC) (ISSN:09196072)
巻号頁・発行日
vol.2007, no.79, pp.7-12, 2007-08-01

本研究室で提案しているツインテール・アーキテクチャでは,発行幅を増やさずにスーパスカラ・プロセッサに演算器を追加することで実質的に発行幅が増えたような効果が得られる.ツインテール・アーキテクチャでは並列にメモリ・アクセス可能なロード命令が増えることで大きな性能向上が得られる.しかし,プロセッサ内のロード命令の数を増やすためにはロードストア・キューのサイズを大きくする必要があり,配線遅延の増大を招く可能性がある.本論文では,ロードストア・キューからアクセス・オーダ・バイオレーションの検出機構を分離し,アクセス・オーダ・バイオレーションの検出をするバッファを別途設けることで,ツインテール・アーキテクチャにおいて,配線遅延の増大を招くことなく,同時にメモリ・アクセスできるロード命令を増加させるモデルを提案する.シミュレーションによる提案モデルの評価では,ツインテール・アーキテクチャにおいてアクセス・オーダ・バイオレーション検出時の再実行方法を理想的にしたモデルとほぼ同等のIPCの向上が得られた.We propose Twintail Architecture, an architecture which gives effect similar to widening issue width but does not lead to greater latency. Twintail Architecture contributes to superscalar processor's throughput by enabling paralell memory access. However, it seems to provoke wiring delay with enlarging the size of load/store queue for the purpose of increasing in-flight load instructions. In this paper, we propose an reasonable model which increases the number of in-flight load instructions, by decoupling the function of access order violation detection from the load/store queue and enlarging a buffer which detects access order violation. Evaluation showed proposed model improves IPC as well as ideal re-execution model.
著者
樫原 裕大 清水 裕基 三好 健文 吉永 努 入江 英嗣
雑誌
研究報告ユビキタスコンピューティングシステム(UBI)
巻号頁・発行日
vol.2011, no.7, pp.1-8, 2011-11-17
被引用文献数
1

日常で歩行は何気なく行われている.しかし,何も考えずにに歩いていると知らない内に悪い癖がつき,身体に様々な問題が起こる可能性がある.これらの問題は姿勢を意識することで予防・改善することができる.そこで本稿では,スマートフォンに内蔵されている加速度センサを用いて歩行分析を行うことで,歩行時に良い姿勢を意識させるアプリケーションを検討・開発した.これにより,歩行中に悪い姿勢であったときに警報音が鳴り,常に正しい姿勢を使用者に意識させることが可能となった.Although walking is a daily natural action, it might cause many body issues by bad habits of the action unconsciously. Such issues are preventable by consideration good gait. To help this, an application is implemented, which analyzes gait by acceleration sensors embedded in smart phones. The application alarms when bad gait is detected to make user conscious of own gait.
著者
道上 和馬 中村 朋生 小泉 透 入江 英嗣 坂井 修一
雑誌
研究報告システム・アーキテクチャ(ARC) (ISSN:21888574)
巻号頁・発行日
vol.2020-ARC-240, no.31, pp.1-9, 2020-02-20

Approximate Computing は,計算精度と引きかえに実行時間と消費電力の双方を削減する技術である.この技術の適用範囲を広げる上での課題のひとつは,誤差を許容範囲内に収めることである.本論文では,この許容範囲がしばしばユーザの主観によって動的に変化することに着目し,計算精度を動的制御可能なアーキテクチャと計算精度の段階的制御が可能なループ近似手法「Loop Body Switching」を提案する.近似の積極度合いを指示する近似レベルを,Control and Status Register(CSR)に保持し,その値で Loop Body Switching の計算精度を制御する.提案するアーキテクチャをシミュレータ上に実装し,4 つのベンチマークを用いて評価をおこなう.近似レベルの増加に対して実行サイクル数は段階的に減少し,専用の分岐命令とハードウェア装置によりさらに実行サイクル数が減少した.
著者
野村 隼人 入江 英嗣 坂井 修一
雑誌
情報処理学会論文誌コンピューティングシステム(ACS) (ISSN:18827829)
巻号頁・発行日
vol.12, no.3, pp.76-86, 2019-07-29

プロセッサへのデータ供給能力は性能上最も重要な要素の1つであり,これを支えるため近年のプロセッサは大容量のLast Level Cache(LLC)を備えている.キャッシュ容量が大きくなるほど,再参照間隔のより長いキャッシュラインを的確に残すようなキャッシュマネジメントが求められるが,これは簡単なハードウェアで行うには難しい課題であり,現状,LLCには多くのデッドブロックが含まれている一方で,追い出しによるミスが発生していることが知られている.本研究では,ライン追い出しを一時的に凍結し,長期保持による統計的なヒット数向上を可能とするStubborn戦略をベースとして,その活用タイミングを適応的に決定する手法を提案し,性能向上を最大化させながら,性能低下の発生を抑えることを実現する.SPEC CPU 2006からメモリセンシティブな12本のベンチマークをシミュレーションした評価では,LRUに対して最大42.3%,幾何平均で3.8%の性能向上を示した.
著者
田仲 史周 宮永 瑞紀 入江 英嗣 坂井 修一
雑誌
研究報告システム・アーキテクチャ(ARC) (ISSN:21888574)
巻号頁・発行日
vol.2018-ARC-231, no.21, pp.1-6, 2018-06-07

コンテンツ管理システム (CMS) の利用増加などによりインジェクションアタックヘの対策が重要になっている.インジェクションアタックに対する一般的な対策は既知のアタックをデータベース化して入力と照合する事で侵入を検知するものであるが,未知のコードによる攻撃を検出しにくい欠点がある.攻撃コードの既知 / 未知に関わらず包括的なインジェクションアタック検出を可能とする手法として,SWIFT (String Wise Information Tracking) が研究されている.これは,外部入力の文字列がその後どのように使わるかをチェックすることで,攻撃成立の前に実行を停止させる手法である.SWIFT の実証実装 PHP-SWIFT では最新の SQL インジェクション攻撃をデータベース無しで検出できることが確認されているが,この検出部は SQL インジェクションのみをターゲットとしていた.本研究では,他の性質を持つ主要なインジェクション攻撃としてディレクトリトラバーサル攻撃に着目し,PHP-SWIFT 用に同様に検出部を提案する.この拡張によって SWIFT-PHP の実用可能範囲を広げると共に,更に包括的な攻撃検出に向けたフレームワークを開発する.Wordpress プラグインの脆弱性を対象としたディレクトリトラバーサル攻撃を再現し行った評価では,用意した全ての攻撃を検出する事に成功した.
著者
入江英嗣 山中崇弘 佐保田誠 吉見真聡 吉永努
雑誌
研究報告計算機アーキテクチャ(ARC)
巻号頁・発行日
vol.2013-ARC-206, no.5, pp.1-10, 2013-07-24

プロセッサの性能向上の基本戦略は,2000 年頃からはマルチコア構成の拡張が主流となり,トランジスタ資源をコア数の増加に利用することで,効率的に TLP 性能を向上させてきた.しかしこのアプローチも,TLP の収穫逓減やダークシリコンの増加など,継続的な成長には限界が指摘されている.この限界を打ち破り,高性能なメニーコアプロセッサを実現するための課題の一つとして,一つ一つのコアの実行性能と電力効率の双方を高める実行アーキテクチャの開発が挙げられる.ここではピーク ILP 実行幅よりも,コンスタントな高性能と高効率が求められる.3 次元実装技術に代表されるように,パッケージ内トランジスタ数の増加は堅調であり,容量を用いて処理レイテンシと電力を削減するアーキテクチャへの転換が今後のプロセッサ成長の鍵と考えられる.本論文では,ライト・ワンス・マナーに基づいた大きな論理レジスタ空間を導入することで,レジスタリネーミング処理を取り除き,更にはバックエンド幅の増加なく実行性能を増加させる STRAIHGT アーキテクチャを提案し,実現のための技術と性能の見積もりを述べる.STRAIGHT アーキテクチャに見立てたパラメタを用いた初期評価では,同じワークロードに対するエネルギー消費を 12% 削減しながら,同時に約 30% の IPC 向上が得られ,性能/パワー比を改善する新しい実行方式として有効であることが示された.
著者
齋藤 祐典 佐藤 俊治 大村 純一 三好 健文 入江 英嗣 吉永 努
出版者
情報処理学会
雑誌
研究報告ハイパフォーマンスコンピューティング(HPC) (ISSN:21862583)
巻号頁・発行日
vol.2011, no.4, pp.1-8, 2011-03-08

人間の視覚機能を解明するために,その機能の線形モデルを計算機でシミュレーションする手法がある.しかし,計算負荷の問題から簡略化したモデルあるいは一部分だけのシミュレーションのみが行われている.そこで,シミュレーションを高速化するために,プログラムを並列化し,PCクラスタを用いて実行する.本稿では,シミュレーションのコアである畳み込み演算をMPIにより並列化することで,最大43%高速化を達成した.また,実装したシミュレータを用いて錯視画像のオプティカルフローを求めたところ, 錯視現象の要因が得られたことを示す.Numerical simulation for the linear model of visual neurons is the most important approach to understand our visual system from computational viewpoints. We attempt to parallelize the time-consuming simulation on a cluster computer system. We achieved 43% reduction in simulation time by MPI implementation of spatio-temporal convolution formulated in the linear model. Moreover, by analyzing the simulation results, unknown factors on visual illusion are unveiled.
著者
入江 英嗣 森田 光貴 岩崎 央 千竃 航平 放地 宏佳 小木 真人 樫原 裕大 芝 星帆 眞島 一貴 吉永 努
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.55, no.4, pp.1415-1427, 2014-04-15

本論文では,光学シースルー方式HMD向けのユーザインタフェースとして,仮想オブジェクトや現実オブジェクトを指で直接指定することのできる"AirTarget"システムを提案する.AirTargetはHMDに取り付けたカメラからユーザの指の位置を検出し,カメラと視線のずれを補正する新規アルゴリズムにより,指先にカーソルを重畳表示する.軽量なアルゴリズムにより指先はマーカレスで検出され,特定の入力デバイスや外部計算機を必要としない.簡単なジェスチャによってコンピュータにコマンドを送ることができ,プログラムの入力インタフェースとして機能する.ユーザは仮想平面上のデスクトップを指差して操作することや,視界に入った現実オブジェクトを指で切り出して画像検索のクエリとすることができる.このような可搬性と操作感から,外出先を含む日常生活のあらゆるシーンにコンピューティングを浸透させるインタフェースとして有効である.Android端末として機能するHMD上に提案システムを実装し,システムのリアルタイム性,検出精度,操作感の評価を行った.提案システムは18フレーム以上のリアルタイム動作を実現し,また,クリックジェスチャ操作を高い認識率および精度で実現した.In this paper, a system "AirTarget", which can point virtual and real object directly with user's finger is proposed for optic see-through HMD devices. The camera attached to the HMD device detects the position of user's fingertip, calibrates the gap between the sight of the camera and eye, and displays the cursor overlapped to the finger on the virtual plain. Finger detection is done in markerless image processing, so that it does not require specific input devices or external computer. This system enables to send control commands by simple gesture, working as a self-contained interface. The user is able to point a virtual object with their finger, and able to cut out an object of the real sight which can be used as a query of the image searching. Such portability and operability enforces AirTarget as an effective interface to be attached to every scene of daily life including outdoors. We implemented the proposal system on the HMD as an Android device and evaluated its real-time properties, detection accuracy, and operability. The algorithm achieved more than 18fps which is sufficient to real time operation. Also, the quick gesture operation was achieved in high accuracy and recognition rate.
著者
入江 英嗣 荻野 健 勝沼 聡 清水 一人 栗田 弘之 五島 正裕 坂井 修一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. CPSY, コンピュータシステム (ISSN:09135685)
巻号頁・発行日
vol.106, no.3, pp.49-54, 2006-04-07
被引用文献数
3

今日のコンピュータシステムのディペンダビリティは、多くの層に渡る多様な技術を必要とし、維持することが難しくなっている。本論文では、システムの一元的なディペンダビリティ維持を支援するプロセッサとして、一つ一つの命令実行をチェックするプロセッサモデルを提案し、必要となる機能を列挙する。更に、それらの機能を統合したときのオーバヘッドと今後の最適化を概観する。
著者
西村 涼平 菅原 豊 入江 英嗣 平木 敬
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告計算機アーキテクチャ(ARC) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.75, pp.79-84, 2008-07-29

近年,半導体の製造技術の向上によって,1 チップに多数のプロセッサコアを集積することが可能になった.これを実現するために,多くの場合,チップを計算能力当たりで簡素にできる SIMD アーキテクチャが採用されている.この流行に沿ったアーキテクチャとして,Cell プロセッサや GPU が挙げられる.この 2 つのアーキテクチャは,マルチコアで SIMD という点では共通しているものの,細部においては様々な差がある.我々は,これらの差がメモリレイテンシの隠蔽やプログラミングの複雑さなどにおいてどのように表れてくるかを,行列積,FFT,ソーティング,そして ZIP ファイルのパスワードクラッキングの 4 つのアプリケーションを使って調べた.Recently, improvement of manufacturing technology of semiconductors has enabled to accumulate a lot of processor cores to one chip. In order to realize this, in a lot of cases, the SIMD architecture that can enable a chip to be simple per computing ability is adopted. We mention the Cell processor and GPUs as the architectures in accordance with this trend. These architectures are common in points of multicore and SIMD, but they are different in various particulars. We investigated how these differences appear in concealment of memory latency and complexity of programming using the four applications of matrix multiplication, FFT, sorting and password cracking of ZIP files.