著者
清水 俊幸 安島 雄一郎 吉田 利雄 安里 彰 志田 直之 三浦 健一 住元 真司 長屋 忠男 三吉 郁夫 青木 正樹 原口 正寿 山中 栄次 宮崎 博行 草野 義博 新庄 直樹 追永 勇次 宇野 篤也 黒川 原佳 塚本 俊之 村井 均 庄司 文由 井上 俊介 黒田 明義 寺井 優晃 長谷川 幸弘 南 一生 横川 三津夫
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J96-D, no.10, pp.2118-2129, 2013-10-01

スーパーコンピュータ「京」の構成と評価について述べる.「京」はスパコンの広範な分野での利活用を目指した10PFLOPS級のスパコンである.我々は,デザインコンセプトとして,汎用的なCPUアーキテクチャの採用と高いCPU単体性能の実現,高いスケーラビリティのインターコネクトの専用開発,並列度の爆発に抗する技術の導入,高い信頼性,柔軟な運用性,省電力性の実現を掲げ,2011年にそのシステムを完成させた.HPC向けCPU,SPARC64 VIIIfxと,スケーラビリティの高いTofuインターコネクトを専用に開発し,並列度の爆発に抗する技術としてVISIMPACTを実装した.冷却やジョブマネージャ等により,高い信頼性,柔軟な運用性,省電力性を実現した.「京」は2011年6月と11月にTOP500で世界一となった.また,複数のアプリケーションで高い実行効率と性能を確認し,スパコンとしての高い実用性を示した.
著者
清水 俊幸 安島 雄一郎 吉田 利雄 安里 彰 志田 直之 三浦 健一 住元 真司 長屋 忠男 三吉 郁夫 青木 正樹 原口 正寿 山中 栄次 宮崎 博行 草野 義博 新庄 直樹 追永 勇次 宇野 篤也 黒川 原佳 塚本 俊之 村井 均 庄司 文由 井上 俊介 黒田 明義 寺井 優晃 長谷川 幸弘 南 一生 横川 三津夫
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D, 情報・システム (ISSN:18804535)
巻号頁・発行日
vol.96, no.10, pp.2118-2129, 2013-10

スーパーコンピュータ「京」の構成と評価について述べる.「京」はスパコンの広範な分野での利活用を目指した10PFLOPS級のスパコンである.我々は,デザインコンセプトとして,(1)汎用的なCPUアーキテクチャの採用と高いCPU単体性能の実現,(2)高いスケーラビリティのインターコネクトの専用開発,(3)並列度の爆発に抗する技術の導入,(4)高い信頼性,柔軟な運用性,省電力性の実現を掲げ,2011年にそのシステムを完成させた.HPC向けCPU,SPARC64 VIIIfxと,スケーラビリティの高いTofuインターコネクトを専用に開発し,並列度の爆発に抗する技術としてVISIMPACTを実装した.冷却やジョブマネージャ等により,高い信頼性,柔軟な運用性,省電力性を実現した.「京」は2011年6月と11月にTOP500で世界一となった.また,複数のアプリケーションで高い実行効率と性能を確認し,スパコンとしての高い実用性を示した.
著者
臼井 英之 杉崎 由典 冨田 清司 大村 善治 三宅 洋平 青木 正樹
出版者
情報処理学会
雑誌
情報処理学会論文誌コンピューティングシステム(ACS) (ISSN:18827829)
巻号頁・発行日
vol.1, no.2, pp.250-260, 2008-08-21

プラズマ粒子シミュレーションで電磁界成分を更新する際には電流値が必要であり,そのために,個々の粒子の運動量を各空間格子点に集める必要がある.しかし,粒子が空間的にランダムに分布しているため,電流計算の並列演算による高速化は容易ではなく工夫を要する.本論文では,粒子の位置情報を利用して各スレッドに粒子を明示的に割り当てるスレッド並列化アルゴリズムを新しく提案し,OpenMPを用いた実装によりその有効性を検証した.動作検証により,提案手法のCPU台数効果はシミュレーション内の空間格子数の影響を受け,粒子数密度の影響はないことが分かった.特に,各スレッドに割り当てられた空間格子配列がキャッシュに収まりきる程度に細分化される場合,並列台数効果を得やすいことを明らかにした.特に並列台数10前後の場合,その台数効果はスーパリニアとなり,自動並列化コンパイラを用いた電流ルーチン実装に比べて高速になることを明らかにした.また,本提案手法は,各スレッドで全粒子を走査する冗長的な並列化方法であるため,従来アルゴリズムで用いられていた作業領域用配列は不要となり,シミュレーションに必要なメモリ容量を大幅に節約できることを示した.In Particle-In-Cell (PIC) plasma simulations, we calculate the current density to advance the electromagnetic fields. One of the ways to obtain the current density is to gather the velocity moment of each particle to the adjacent grid points. The current calculation is not basically parallelized because the particle positions, which are random in the simulation space, are independent of the array number of current density. In the present paper, we propose a new parallelization method which explicitly associates particles to threads by using OpenMP and evaluate the performance of the proposed method. We clarified that the scalability performance is affected by the number of spatial grid points and is independent of the number of particle per grid. In the proposed method, each thread is in charge of a part of the array of current density divided with the number of thread. When the memory size of the array allocated to each thread becomes small and close to the data cache size of CPU, we found that the scalability performance shows super-linear characteristics and the execution needs less time than the case of using the automatic parallelization compiler. In addition, each thread redundantly scans the particle array to obtain the information of the particle positions for assigning the corresponding particles in charge. Because of this redundant parallelization, we do not have to use work arrays and can save the memory consumed for simulations.
著者
佐藤 嘉洋 矢垣 真也 吉田 親子 能代 英之 佐藤 雅重 青木 正樹 杉山 芳弘
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SDM, シリコン材料・デバイス (ISSN:09135685)
巻号頁・発行日
vol.105, no.654, pp.23-28, 2006-03-07

高集積MRAM用のトンネル磁気抵抗素子(MTJ)として、低い反転磁界と高いディスターブ耐性を同時に満たすアステロイド特性と、最小セルサイズ8F^2を実現する砂時計型MTJを提案する。Landau-Lifshitz-Gilbert (LLG)シミュレーションによると、この砂時計型MTJは反転磁界が低減するように磁化反転時のスピン分布状態が動く特徴であり、従来のMTJ形状の磁化反転過程とは異なる。今回我々は260×420nm^2サイズの砂時計型MTJと200×400nm^2サイズの楕円MTJを試作した。LLGシミュレーションの結果と同様に、理想的なアステロイド曲線と楕円MTJよりも50%低い反転磁界を実現した。