著者
廣川 祐太 朴 泰祐 佐藤 駿丞 矢花 一浩
雑誌
情報処理学会論文誌コンピューティングシステム(ACS) (ISSN:18827829)
巻号頁・発行日
vol.9, no.4, pp.1-14, 2016-11-17

近年,Intel Xeon Phiなどメニーコアプロセッサを搭載したPCクラスタが運用されているが,同プロセッサの性能特性から実アプリケーションにおいて高い性能を得るのは非常に困難である.本研究では,電子動力学シミュレータARTEDでの支配的な計算である波数空間と軌道に関して並列化された3次元実空間格子の25点ステンシル計算を,メニーコアプロセッサに対し最適化することを目的とする.まず,元のターゲットシステムである京コンピュータ(SPARC64 VIIIfx)に対し最適化を行い,コンパイラによる自動ベクトル化を促進することで14.94GFLOPSから27.2GFLOPSに性能が向上した.この実装を用いて,メニーコアプロセッサのIntel Xeon Phi(Knights Corner)を対象に,自動ベクトル化とIntrinsicsを用いた手動ベクトル化による最適化を行った.元実装が30.06GFLOPSであるのに対し,手動ベクトル化実装で224.45GFLOPSと20.9%のピーク演算性能比を達成した.また,次世代プロセッサのKnights Landingへの実装などについても考察する.