著者
酒居 敬一 光成 滋生 成田 剛 石田 計 藤井 寛 庄司 信利
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.43, no.4, pp.1028-1038, 2002-04-15

近年の汎用パーソナルコンピュータに多く使われているIA-32プロセッサは過去との互換性のために命令体系はCISC的である.しかし内部動作はRISCマイクロ命令への変換,ハイパーパイプライン,アウトオブオーダ,などRISC的アーキテクチャが多数取り入れられている.さらにSIMD的演算命令の搭載によりデータ並列処理を実現している.とはいえその新しい機構に応じたコードを生成するコンパイラはまだまだ少数であり,また対応していたとしてもコンパイラ独自の拡張C言語による記述が必要であることが多い.そのため通常のC言語による記述を主体としたベンチマークではプロセッサの正当な評価を行いにくい.そこで我々は実用的なアプリケーションとしてMP3エンコーダを選択しコード全般にわたってアセンブリ言語による最適化処理を行った.その結果C言語によるコードに対し2倍から3倍の高速化を達成した.
著者
酒居 敬一 光成 滋生 成田 剛 石田 計 藤井 寛 庄司 信利
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. ARC,計算機アーキテクチャ研究会報告 (ISSN:09196072)
巻号頁・発行日
vol.144, pp.141-146, 2001-07-25
参考文献数
12
被引用文献数
1

近年, マルチメディアアプリケーション向けの拡張命令をサポートした汎用プロセッサが入手できるようになってきた.PCMオーディオをmp3にする処理は遅いと感じていたし, 速いエンコーダが切望されていた.そこでAMDの3DNow!やIntelのSSEという拡張命令に着目し, それらの命令をエンコーダの高速化のために使用した.「午後のこ〜だ」は, 「LAME]を高速化したmp3エンコーダで, そのような命令を使うようにアセンブリ言語で書き換えたものである.さらに440BXチップセットによるIntelSMPにも着目し, マルチスレッド実行による速いmp3エンコーディングも実装してみた. 本稿では「午後のこ〜だ」に実装した高速化手法や速度向上について述べる.
著者
酒居 敬一 光成 滋生 成田 剛 石田 計 藤井 寛 庄司 信利
雑誌
情報処理学会研究報告計算機アーキテクチャ(ARC)
巻号頁・発行日
vol.2001, no.76(2001-ARC-144), pp.141-146, 2001-07-25

近年、マルチメディアアプリケーション向けの拡張命令をサポートした汎用プロセッサが入手できるようになってきた.PCMオーディオをmp3にする処理は遅いと感じていたし,速いエンコーダが切望されていた.そこでAMDの3D Now!やIntelのSSEという拡張命令に着目し,それらの命令をエンコーダの高速化のために使用した.「午後のこ?だ」は,「LAME」を高速化したmp3エンコーダで,そのような命令を使うようにアセンブリ言語で書き換えたものである.さらに440BXチップセットによるIntel SMPにも着目し,マルチスレッド実行による速いmp3エンコーディングも実装してみた.本稿では「午後のこ?だ」に実装した高速化手法や速度向上について述べる.
著者
酒居 敬一 光成 滋生 成田 剛 石田 計 藤井 寛 庄司 信利
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.43, no.4, pp.1028-1038, 2002-04-15
参考文献数
19

近年の汎用パーソナルコンピュータに多く使われているIA-32プロセッサは過去との互換性のために命令体系はCISC的である.しかし内部動作はRISCマイクロ命令への変換,ハイパーパイプライン,アウトオブオーダ,などRISC的アーキテクチャが多数取り入れられている.さらにSIMD的演算命令の搭載によりデータ並列処理を実現している.とはいえその新しい機構に応じたコードを生成するコンパイラはまだまだ少数であり,また対応していたとしてもコンパイラ独自の拡張C言語による記述が必要であることが多い.そのため通常のC言語による記述を主体としたベンチマークではプロセッサの正当な評価を行いにくい.そこで我々は実用的なアプリケーションとしてMP3エンコーダを選択しコード全般にわたってアセンブリ言語による最適化処理を行った.その結果C言語によるコードに対し2倍から3倍の高速化を達成した.The architecture of IA-32 processors, which are recently used in personalcomputers in general, can execute the industry-standard x86 instruction setlike CISC for binary compatibility.But in fact, the processors process simpler RISC micro operations instead ofcomplex x86 instructions, and support hyper pipelined technology and out-of-oder speculative execution.IA-32 processor also has the SIMD instructions.However, there are few compilers which generate the code supporting the newtechnology, or we must use the extended C language, if any.Therefore it is difficult to evaluate the processor exactly by the benchmarkbased on the ordinary C language.Then we chose a MP3 encoder for practical application and rewrote the mainroutines of the encoder by assembly language.As a result, we have achieved about two or three times faster optimization.
著者
西谷 隆夫 岩田 誠 酒居 敬一
出版者
首都大学東京
雑誌
基盤研究(B)
巻号頁・発行日
2005

携帯端末で映像から情報入力を行う際の前処理演算の効率化として多重解像度処理とそれを実現するTOPS(テラ・オペレーションズ・パー・セコンド)までスケーラブルに拡張できるマルチプロセッサのアーキテクチャについて検討した。映像からのデータを活用する前処理は従来の空間的な相関に加え、画素単位の時間的な処理に重点が移りつつある。空間的な処理としてカラー画像強調アルゴリズムの演算量削減を、また、時間的な処理に空間的な要素を加え、安定性と低演算処理を狙った混合ガウス背景モデルによる前景分離を対象に検討を行った結果、双方とも従来例に比べ大幅な演算量削減を実現できた。カラー画像強調と前景モデルを組み合わせることで逆光などの劣悪状況でも追跡が可能なことも示せた。どちらの応用もローカル処理や画素ごとの判定が多く、超並列プロセッサ向きである。また、判定処理が多く、プロセッサ自体をパイプライン化すると条件判定で無駄命令が多発することも明確になった。このため、昨年度提案した超並列DSPを発展させ、その利点を明らかにした。その結果、アルゴリズムは超並列で論じ、ハードウェアはパイプライン化しない範囲の高い周波数で動作させ、超並列アルゴリズムの一部を多重化させる方式が良いとの結論になった。また、昨年度導入したセグメントバスを有効に使うと動き補償などの空間処理で最も効率が良いとされていたシストリックアレーを凌駕するアルゴリズムを導出でることも明らかになった。このアーキテクチャを1985年ごろのパイプライン処理を行わないDSPをベースにFPGAで作ると1チップに約300個実装できることを実験的に確かめた。
著者
阿江 忠 酒居 敬一 豊崎 剛
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告計算機アーキテクチャ(ARC)
巻号頁・発行日
vol.1994, no.91, pp.79-86, 1994-10-27

メモリベース推論はモデル表現が陽でないリアルワールド向きであるが、そのインプリメントに通常の超並列マシンを用いることはコストパフォーマンスの点で問題がある。メモリベース推論はメモリベースアーキテクチャで実現するのが適当であり、ニューラルネットを能動メモリとして採用することができる。一方、メモリベース推論のみでトータルシステムを構築するのは困難であり、通常のAIシステムとの融合も必要となる。新機能マシンNFMは、知識の獲得、表現をメモリベースで行ない、知識の進化を協調動作により実現するシステムであるが、メモリベースのオブジェクトとプログラムベースのオブジェクトの協調動作を利用するのも特徴の一つである。The conventional massively parallel computers are too huge to implement the memory-based reasoning that is appropriate to realize the real world. The memory-based architecture fits the memory-based reasoning, where the neural networks play an role of active memory. The total system, however, requires also the conventional AI tecnique, and therefore, it must be realized to combine the memory-based reasoning with the conventional reasoning. NFM, a new functional machine, is proposed for this pupose and its outline is described.