著者
北村 俊明 中田 登志之 柴山 潔 富田 眞治 萩原 宏
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.27, no.4, pp.445-453, 1986-04-15
被引用文献数
1

算術論理演算装置(ALU)-レジスタ・レベルでの並列処理機能を有するマイクロプログラム制御計算機 QA-2を開発した.QA-2 は 旧型機 QA-1 における各種の応用実験を通じて行った性能評価に基づいて そのハードウェア構成方式を改良したシステムである. QA-2 は そのマイクロプログラムを書き換えることによって 図形処理や信号処理などのリアルタイム処理 および高級言語処理に対する効率の良いシステムを提供できる. QA-2 では 256ビット長の水平型マイクロ命令の相異なるフィールドによって 4個の可変長 ALU演算 4個の主記憶アドレスヘのアクセス 1個の高機能順序制御を同時に指定できる低レベル並列処理方式が採用されており マイクロプログラム制御方式の柔軟性を生かして 多様な応用に対処できるようになっている.また 処理速度や適応能力のほかにマイクロプログラムの生産性を上げることをも考慮して マイクロ・アーキテクチャを一様に構成している.本論文では QA-2 システムの設計思想を明らかにし その最大の特徴である低レベル並列処理機構の実現方式について述べる.また 実際に QA-2 を応用した結果を示し 低レベル並列処理方式の有効性について評価を加える.
著者
本庄 賢光 窪田 昌史 北村 俊明
出版者
情報処理学会
雑誌
研究報告システムソフトウェアと オペレーティング・システム(OS) (ISSN:09196072)
巻号頁・発行日
vol.2010, no.17, pp.1-11, 2010-07-27
参考文献数
9

並列処理環境の普及に伴い,MPI (Message Passing Interface) の並列プログラムを,異なる性能のノードから構成される PC クラスタの非均質性とノードの耐故障性に対応させる要求が高まっている.我々は MPI プロセスを Xen の仮想計算機 (VM) 上で稼働させることによって,PC クラスタの非均質性と耐故障性に対応させる手法を提案してきた.しかし VM 上で MPI プロセスを稼働させるとオーバーヘッド大きくなることがある.本研究では,Xen のクレジットスケジューラのタイムスライスとティックの値を変更することと,Domain0 の優先度を変更することによる MPI プロセスの高速化を行った.高速化の評価のためにデュアルコアプロセッサ Core2Duo 3.00GHz,メモリ4GB のノード上で VM を稼働させ,NAS Parallel Benchmarks 3.3 クラス A のアプリケーション SP の MPI プログラムの実行した.タイムスライスとティックをデフォルトの 30ms,10ms から共に 1ms にし,2 ノード 4 プロセスで実行させたところ 33% 高速化された.さらに Domain0の 優先度を 1024 にすることで通常時と比べ,35% 高速化された.As HPC and parallel processing environment becomes popular, the demand that parallel programs with MPI(Message Passing Interface) should support heterogeneity on PC clusters with consist of the nodes with different computing power and fault-tolerance of the nodes has arised. We have proposed a technique to support heterogeneity and fault-tolerance for PC clusters by executing MPI processes on virtual machines so that those processes can be easily migrated between nodes. However, when MPI programs are executed on virtual machine Xen, the overhead sometimes becomes large. We therefore make it possible to change the values of the time slice and the tick, which are parameters the Credit Scheduler uses to allocate CPU time, so that the overhead incurred by waiting for receiving data is reduced and the performance of MPI programs is improved. To evaluate the effectiveness of the improvement, we executed the application SP Class A of NAS Parallel Benchmarks 3.3 on virtual machines running on nodes with dual core processor Core2Duo 3.00GHz and 4GB main memory. When SP is executed with four processes on two nodes where the values of the time slice and the tick are both changed to 1ms from the default values of 30ms and 10ms, the performance is improved by 33%. In addition, Domain0's weight is changed from 256 to 1024 ,the performance is improved by 35%.