著者
酒居 敬一 光成 滋生 成田 剛 石田 計 藤井 寛 庄司 信利
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.43, no.4, pp.1028-1038, 2002-04-15

近年の汎用パーソナルコンピュータに多く使われているIA-32プロセッサは過去との互換性のために命令体系はCISC的である.しかし内部動作はRISCマイクロ命令への変換,ハイパーパイプライン,アウトオブオーダ,などRISC的アーキテクチャが多数取り入れられている.さらにSIMD的演算命令の搭載によりデータ並列処理を実現している.とはいえその新しい機構に応じたコードを生成するコンパイラはまだまだ少数であり,また対応していたとしてもコンパイラ独自の拡張C言語による記述が必要であることが多い.そのため通常のC言語による記述を主体としたベンチマークではプロセッサの正当な評価を行いにくい.そこで我々は実用的なアプリケーションとしてMP3エンコーダを選択しコード全般にわたってアセンブリ言語による最適化処理を行った.その結果C言語によるコードに対し2倍から3倍の高速化を達成した.
著者
酒居 敬一 光成 滋生 成田 剛 石田 計 藤井 寛 庄司 信利
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. ARC,計算機アーキテクチャ研究会報告 (ISSN:09196072)
巻号頁・発行日
vol.144, pp.141-146, 2001-07-25
参考文献数
12
被引用文献数
1

近年, マルチメディアアプリケーション向けの拡張命令をサポートした汎用プロセッサが入手できるようになってきた.PCMオーディオをmp3にする処理は遅いと感じていたし, 速いエンコーダが切望されていた.そこでAMDの3DNow!やIntelのSSEという拡張命令に着目し, それらの命令をエンコーダの高速化のために使用した.「午後のこ〜だ」は, 「LAME]を高速化したmp3エンコーダで, そのような命令を使うようにアセンブリ言語で書き換えたものである.さらに440BXチップセットによるIntelSMPにも着目し, マルチスレッド実行による速いmp3エンコーディングも実装してみた. 本稿では「午後のこ〜だ」に実装した高速化手法や速度向上について述べる.
著者
酒居 敬一 光成 滋生 成田 剛 石田 計 藤井 寛 庄司 信利
雑誌
情報処理学会研究報告計算機アーキテクチャ(ARC)
巻号頁・発行日
vol.2001, no.76(2001-ARC-144), pp.141-146, 2001-07-25

近年、マルチメディアアプリケーション向けの拡張命令をサポートした汎用プロセッサが入手できるようになってきた.PCMオーディオをmp3にする処理は遅いと感じていたし,速いエンコーダが切望されていた.そこでAMDの3D Now!やIntelのSSEという拡張命令に着目し,それらの命令をエンコーダの高速化のために使用した.「午後のこ?だ」は,「LAME」を高速化したmp3エンコーダで,そのような命令を使うようにアセンブリ言語で書き換えたものである.さらに440BXチップセットによるIntel SMPにも着目し,マルチスレッド実行による速いmp3エンコーディングも実装してみた.本稿では「午後のこ?だ」に実装した高速化手法や速度向上について述べる.
著者
酒居 敬一 光成 滋生 成田 剛 石田 計 藤井 寛 庄司 信利
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.43, no.4, pp.1028-1038, 2002-04-15
参考文献数
19

近年の汎用パーソナルコンピュータに多く使われているIA-32プロセッサは過去との互換性のために命令体系はCISC的である.しかし内部動作はRISCマイクロ命令への変換,ハイパーパイプライン,アウトオブオーダ,などRISC的アーキテクチャが多数取り入れられている.さらにSIMD的演算命令の搭載によりデータ並列処理を実現している.とはいえその新しい機構に応じたコードを生成するコンパイラはまだまだ少数であり,また対応していたとしてもコンパイラ独自の拡張C言語による記述が必要であることが多い.そのため通常のC言語による記述を主体としたベンチマークではプロセッサの正当な評価を行いにくい.そこで我々は実用的なアプリケーションとしてMP3エンコーダを選択しコード全般にわたってアセンブリ言語による最適化処理を行った.その結果C言語によるコードに対し2倍から3倍の高速化を達成した.The architecture of IA-32 processors, which are recently used in personalcomputers in general, can execute the industry-standard x86 instruction setlike CISC for binary compatibility.But in fact, the processors process simpler RISC micro operations instead ofcomplex x86 instructions, and support hyper pipelined technology and out-of-oder speculative execution.IA-32 processor also has the SIMD instructions.However, there are few compilers which generate the code supporting the newtechnology, or we must use the extended C language, if any.Therefore it is difficult to evaluate the processor exactly by the benchmarkbased on the ordinary C language.Then we chose a MP3 encoder for practical application and rewrote the mainroutines of the encoder by assembly language.As a result, we have achieved about two or three times faster optimization.