著者
秋山 隼太 小路 真史 三宅 洋平 大村 善治 中島 浩
出版者
一般社団法人情報処理学会
雑誌
研究報告ハイパフォーマンスコンピューティング(HPC) (ISSN:09196072)
巻号頁・発行日
vol.2010, no.8, pp.1-11, 2010-02-15
参考文献数
6

本論文では,粒子・流体ハイブリッドプラズマシミュレーションの,負荷分散技法 OhHelp を用いた並列化について述べる.すでに OhHelp を適用して良好な結果が得られている全粒子シミュレーションに比べ,ハイブリッドシミュレーションは電磁場の計算負荷が相対的に大きいため,計算と通信のバランスを大幅に見直した実装を行った.特に Cyclic Leapfrog 法による電磁場計算に関する,通信回数削減と計算量増加のトレードオフポイントを見出すことが可能な設計とした.また実用的なシミュレーションに不可欠な,スナップショットやダンプファイルの出力方式も検討し,並列 I/O を用いて並列性能と利便性の両立を図る設計・実装を行った.性能評価の結果,256 プロセスでの実行で 241-456 倍の台数効果が得られること,電磁場計算では計算量増加を抑えることが効果的であること,およびスナップショットと Weak/Strong Scalability との関係が明らかになった.This paper describes a parallel implementation of particle-fluid hybrid plasma simulation with our load balancing method OhHelp. In hybrid simulation, the cost to simulate the progress of electromagnetic field is more significant than that in full-particle simulation whose OhHelp'ed parallelization has already been proved efficient. Thus in this work we revisited the issue of the cost balance between computation and communication, especially for Cyclic Leapfrog method and the trade-off between reducing the number of communications and increasing computational amount. We also designed and implemented parallel-I/O for snapshot and dump, being essential for practical use of our simulator, to reconcile parallel performance and convenience of users. Our evaluation exhibited that the speedup with 256 process is 241- to 456-fold and that suppressing computational cost is the first priority in Cyclic Leapfrog. We also obtained valuable insights about the relationship between weak/strong scalability and snapshot frequency.
著者
臼井 英之 杉崎 由典 冨田 清司 大村 善治 三宅 洋平 青木 正樹
出版者
情報処理学会
雑誌
情報処理学会論文誌コンピューティングシステム(ACS) (ISSN:18827829)
巻号頁・発行日
vol.1, no.2, pp.250-260, 2008-08-21

プラズマ粒子シミュレーションで電磁界成分を更新する際には電流値が必要であり,そのために,個々の粒子の運動量を各空間格子点に集める必要がある.しかし,粒子が空間的にランダムに分布しているため,電流計算の並列演算による高速化は容易ではなく工夫を要する.本論文では,粒子の位置情報を利用して各スレッドに粒子を明示的に割り当てるスレッド並列化アルゴリズムを新しく提案し,OpenMPを用いた実装によりその有効性を検証した.動作検証により,提案手法のCPU台数効果はシミュレーション内の空間格子数の影響を受け,粒子数密度の影響はないことが分かった.特に,各スレッドに割り当てられた空間格子配列がキャッシュに収まりきる程度に細分化される場合,並列台数効果を得やすいことを明らかにした.特に並列台数10前後の場合,その台数効果はスーパリニアとなり,自動並列化コンパイラを用いた電流ルーチン実装に比べて高速になることを明らかにした.また,本提案手法は,各スレッドで全粒子を走査する冗長的な並列化方法であるため,従来アルゴリズムで用いられていた作業領域用配列は不要となり,シミュレーションに必要なメモリ容量を大幅に節約できることを示した.In Particle-In-Cell (PIC) plasma simulations, we calculate the current density to advance the electromagnetic fields. One of the ways to obtain the current density is to gather the velocity moment of each particle to the adjacent grid points. The current calculation is not basically parallelized because the particle positions, which are random in the simulation space, are independent of the array number of current density. In the present paper, we propose a new parallelization method which explicitly associates particles to threads by using OpenMP and evaluate the performance of the proposed method. We clarified that the scalability performance is affected by the number of spatial grid points and is independent of the number of particle per grid. In the proposed method, each thread is in charge of a part of the array of current density divided with the number of thread. When the memory size of the array allocated to each thread becomes small and close to the data cache size of CPU, we found that the scalability performance shows super-linear characteristics and the execution needs less time than the case of using the automatic parallelization compiler. In addition, each thread redundantly scans the particle array to obtain the information of the particle positions for assigning the corresponding particles in charge. Because of this redundant parallelization, we do not have to use work arrays and can save the memory consumed for simulations.
著者
安部 達也 平石 拓 三宅 洋平 岩下 武史 中島 浩
雑誌
研究報告ハイパフォーマンスコンピューティング(HPC)
巻号頁・発行日
vol.2011, no.59, pp.1-8, 2011-07-20

分散制約充足問題を分散並列計算環境で解くにあたり,ジョブを処理の単位とする分散並列処理 (ジョブ並列) に特化したジョブ並列スクリプト言語 Xcrypt で処理を記述することにより,実際の分散並列計算環境であるところの,いわゆるスーパーコンピュータを利用する方法を紹介する.さらに,Xcrypt の遠隔ジョブ投入機構を利用することにより,制約が遠隔の計算機に分散された状態からの制約充足問題,つまり,真の意味での分散制約充足問題を簡便に取り扱うことができることを示す.We introduce a method of parallel executions based on the job unit (job-level parallel executions) for solving distributed constraint satisfaction problems (DCSPs) in parallel and distributed computation environments, the so-called today's many supercomputers. Throughout introducing the method we use the job-level parallel script language Xcrypt, specific to job-level parallel executions. We also show that Xcrypt provides us with a feature of submitting remotely jobs for solving realistic DCSPs (under the circumstances that constraints are truely distributed in separate computers).
著者
三宅 洋平 臼井 英之
出版者
神戸大学
雑誌
若手研究(B)
巻号頁・発行日
2013-04-01

3次元電磁モデル大規模プラズマ粒子シミュレーションにより、太陽近傍プラズマ環境中における科学衛星プラズマ相互作用を定量的に解明した。特に①強太陽放射による大量の光電子放出にもかかわらず、空間電荷制限電流の効果により衛星は負に帯電する、②太陽風プラズマ中の対流電場に起因する光電子の非対称分布が衛星搭載電場プローブ位置に数100 mV/mの強い人工電場を発生させる、③衛星からの光電子放出電流により最大数nT程度の局所磁場変動が起こりうる、などの結果により、これまで人類が経験したことのない極限環境における衛星プラズマ相互作用の実態を明らかにし、将来衛星計画の設計に適用可能な知見を得ることに成功した。