著者
南 武志 岩下 武史 中島 浩
雑誌
研究報告ハイパフォーマンスコンピューティング(HPC)
巻号頁・発行日
vol.2011, no.65, pp.1-8, 2011-07-20

本論文では高周波電磁場解析の一手法である 3 次元 FDTD 法におけるキャッシュメモリを考慮した性能改善手法の提案と性能評価を行う.3 次元 FDTD 法の計算カーネルは時間発展に関するループにより与えられ,各タイムステップにおいて電場と磁場の値が交互に更新される.3 次元 FDTD 法の計算カーネルは演算あたりのロード/ストア量が大きく,一般にメモリ帯域の影響を受けやすい計算である.キャッシュメモリのヒット率を向上しメインメモリへのアクセスによる性能の低下を軽減する性能改善手法として,解析領域をタイルと呼ぶ小領域に分割し各タイル内で複数のタイムステップに関する処理を連続して行うタイリングと呼ばれる手法が存在する.しかし,単純な固定タイルによる実装では,タイル間での冗長な計算がオーバーヘッドとなっていた.そこで,本論文ではタイリング手法において,タイルの位置と形状を時間ステップごとに変化させ計算量の増加を防ぐ手法を提案する.提案手法を評価した結果,AMD 製クアッドコア Opteron プロセッサよる数値実験において 4 スレッドによる並列処理を行った場合,一般的な 3 次元 FDTD 法の実装と比較して計算時間を約 50% 短縮させることに成功した.This paper deals with performance improvement of three dimensional FDTD kernel for high frequency electromagnetic field analyses. The FDTD method is one of explicit time stepping methods. The electric and magnetic fields are updated alternately in each time step. Since the calculation of the FDTD method has a large byte/flop ratio, its performance is limited by memory throughput. For a remedy of it, there is a technique called tiling, in which the analyzed domain is divided into multiple small domains. By updating electrical and magnetic fields in each small domain in multiple time steps, we can utilize cache data efficiently. However, when we implement tiling based on simple fixed size tiles, redundant calculations are required between adjacent tiles. In this paper, we propose a new tiling technique for three dimensional FDTD method without redundant calculations. This method prevents an increase in the amount of calculations by changing the position and shape of the tile at each time step. Numerical tests on a quad-core AMD Opteron processor show that the proposed three dimensional FDTD method attains up to 50 percent reduction in the calculation time compared with an ordinary implementation of the three dimensional FDTD method.

言及状況

Twitter (1 users, 1 posts, 1 favorites)

こんな論文どうですか? 3次元FDTDカーネルのキャッシュメモリを考慮した性能改善の実装と性能評価(南 武志ほか),2011 http://t.co/bI8RCrGH

収集済み URL リスト