著者
谷村 勇輔 的野 晃整 小島 功 田中 良夫 関口 智嗣
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告ハイパフォーマンスコンピューティング(HPC) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.74, pp.223-228, 2008-07-29

ユビキタスコンピューティングの世界で用いられる"ucode"を管理するシステムに RDF-DB (RDF database) を利用するには,スケーラブルな RDF-DB を構築する技術の確立が必要である.そこで,我々は RDF-DB のバックエンドに分散ストレージと MapReduce フレームワークを用いた並列データ処理を利用することで,膨大なデータに対する多数の問合せに対応したシステムの構築を試みている.本稿では,まず MapReduce を実装する Hadoop において,データベースの結合演算を行うプログラムの性能を評価した.次に, Hadoop と RDF-DB のそれぞれの特徴に基づき,データベースの基本的なデータ格納手法である Vertical Partitioning,Horizontal Partitioning,Sorting をもとに, MapReduce フレームワークにおける RDF-DB に適したデータの分散格納方法を提案する.そして,約 274 万のトリプルに対して, 2 または 3 組の predicate を選択条件とし, subject に対する結合演算を行う問合せを用いて評価実験を行った.これらを通じて,最終的に構築しようとしているシステムの設計を行う上での基本的な知見を得た.Research for scalable RDF-DB (RDF database) is highly expected today, in order to construct the "ucode" management system in the ubiquitous world. Our approach is to use parallel data processing technology with distributed storage and MapReduce framework, as a backend of RDF-DB. In this report, performance of the JOIN operation in the database domain was evaluated on the Hadoop cluster, in which MapReduce framework is provided by Hadoop. Then data storing/distributing methods based on conventional Vertical Partitioning, Horizontal Partitioning and Sorting, are proposed so that they take advantages of the Hadoop behaviors and the RDF-DB features. The proposed methods were evaluated by the experiment with the query which selects the RDF triples by 2 or 3 predicates and joins the triples on the subject from 2.4 millions' triples. Through the examinations, the design principle of our developing scalable RDF-DB system was confirmed.
著者
首藤 一幸 関口 智嗣 村岡 洋一
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.44, no.6, pp.1570-1582, 2003-06-15

IA-32プロセッサは,IEEE 754準拠であるにもかかわらず,ある浮動小数点演算に対して他のプロセッサとは異なる結果を返す.IA-32プロセッサ上で他のプロセッサと同一の演算結果を得るための対処をJava Just-in-Timeコンパイラに実装した.倍精度数の演算ではストア--リロードとスケーリングを行う必要があるが,単精度数の演算では丸め精度を倍精度としたままストア--リロードだけ行えば十分であることが明らかになった.また,いくつかの実装方法について性能への影響を調べたところ,スケーリング専用命令ではなく乗算命令を用いることで性能の低下幅は約40%にまで抑えられることが分かった.
著者
建部修見 森田 洋平 松岡 聡 関口 智嗣 曽田 哲之
雑誌
情報処理学会研究報告ハイパフォーマンスコンピューティング(HPC)
巻号頁・発行日
vol.2001, no.77(2001-HPC-087), pp.177-182, 2001-07-25

ペタバイトスケールデータインテンシブコンピューティングのためのGridDatafarmアーキテクチャの設計と実装を行っている.Grid Datafarmは,PCクラスタのローカルディスクを利用した広域データ並列ファイルシステムを提供し,オンラインでペタバイト規模の大容量と,ローカルI/Oバンド幅を利用したスケーラブルなI/Oバンド幅が特徴である.Gfarm並列I/O APIおよびGfarmコマンドにより,単一システムイメージの操作を可能とする.ファイルの複製,ヒストリによる再生成などにより,自動的な耐故障性,負荷分散も目指している.
著者
建部修見 児玉 祐悦 関口 智嗣 山口 喜教
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.40, no.5, pp.2246-2255, 1999-05-15
被引用文献数
5

MPIはpoint-to-point通信における対応する送信と受信のマッチングに関するコストが大きく 通信遅延が大きくなる原因となっている. 本研究では ノンブロッキング受信が先行発行される通信パターンにおいて 送信時に受信側に問い合わせることなくリモートメモリ書き込みにより送信を行う方式を提案し 高並列計算機EM-Xに実装しその評価を行った. その結果 通信遅延15.3μsec スループット31.4MB/sを達成し 他MPPに実装されているMPIに比べ優位な性能を示した. 本手法は 他システムにおいても適応可能であり ハードウェアスペックどおりの低遅延 高スループットを得るためには重要な方式と考えられる.MPI point-to-point communication is a basic operation, however it requires runtime-matching of send and receive that causes to reduce performance. This paper proposes a new approach to send messages by remote memory write without inquiring of the receiver under a communication pattern such that the corresponding nonblocking receive is issued in advance. Basically, this approach makes it possible to gain low latency and high bandwidth as the hardware specification. MPI-EMX, our implementation of the MPI on the EM-X multi-processor, achieves a zero-byte latency of 15.3 μsec and a maximum bandwidth of 31.4 MB/s, which can compete with commercial MPPs. This approach to reduce communication latency is widely applicable to other systems and is quite a promising technique for achieving low latency and high bandwidth.
著者
小野 功 水口 尚亮 中島 直敏 小野 典彦 中田 秀基 松岡 聡 関口 智嗣 楯 真一
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌コンピューティングシステム(ACS) (ISSN:18827829)
巻号頁・発行日
vol.46, no.12, pp.396-406, 2005-08-15
被引用文献数
3

本論文では,Ono らが提案したNMR 蛋白質立体構造決定のための遺伝アルゴリズム(GA)を,複数のWAN 上のPC クラスタ群から構成されるグリッド上で並列化したシステムを提案し,提案システムの性能評価を行った結果を報告する.提案システムは,マスタ,サブマスタ,ワーカから構成される階層的なマスタ・ワーカ方式を用いて並列化されている.マスタと各PC クラスタ間の通信はセキュアなGridRPC ミドルウェアNinf-G を用いて,また,PC クラスタ内の通信は高速なGridRPCミドルウェアNinf-1 を用いて実現されている.さらに,提案システムでは,Ninf-G によるインターネット上の通信遅延を隠蔽するため,スライド転送手法を導入している.5 サイト/1 196CPU から構成されるグリッドテストベッドで,78 残基からなる蛋白質の立体構造決定問題を用いて,提案システムの性能評価を行った結果,高い並列化効率を示すことが確認された.In this paper, we parallelize the genetic algorithm (GA) for NMR protein three-dimensional structure determination, which has been proposed by Ono et al., on a grid that consists of multiple PC clusters on the WAN and report some results on the performance evaluation of the proposed system. The proposed system is parallelized with the hierarchical master-worker paradigm and consists of a master, submasters and workers. The communication between the master and each PC cluster is realized with Ninf-G, which is a secure GridRPC middleware, and that in each PC cluster is implemented by using Ninf-1, which is a fast GridRPC middleware. In the proposed system, we employ the slide transfer technique in order to hide the latency of communication on the Internet by using Ninf-G. The experimental results on the grid testbed consisting of 5 sites/1,196 CPUs showed that the proposed system effectively utilized computing resources on the grid testbed when it was applied to a problem of determining the three-dimensional structure of a 78-residue protein.
著者
関口 智嗣
出版者
日経BP社
雑誌
日経バイト (ISSN:02896508)
巻号頁・発行日
no.264, pp.91-96, 2005-05

筆者が会長を務めているグリッド協議会では,複数のコンピュータによる分散処理「グリッド・コンピューティング」に関するWebニュースを集めている。略して「グリッド」と称されることが多いこの言葉は,ほぼ毎日のように報道発表やニュース記事としてWebサイトの更新チェック・プログラムに引っかかる。
著者
竹房 あつ子 小川 宏高 松岡 聡 中田 秀基 高木 浩光 佐藤三久 関口 智嗣 長嶋 雲兵
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.39, no.6, pp.1827-1838, 1998-06-15
参考文献数
14

広域ネットワークの整備につれ,高性能広域分散計算を実現する試みが我々のNinfを含めていくつか行われている.しかしこのような広域計算システムの,特にWANにおいて複数のクライアントが複数のサイトに分散している状況下での性能特性に関する議論は十分になされていない.本稿では,Ninfおよび類似のシステムの実現可能性を調査するため,LAN/WAN環境でLinpack/EPベンチマークを実施し,次のような結果を得た.1)十分なバンド幅があれば,Ninfを用いた方がLocal実行するより高速になる.2)既存の高性能計算機は性能や耐久性の点で広域計算システムの運用に十分なプラットフォームである.3)ベクトル並列計算機(Cray J90)では,高性能並列ライブラリが有効利用できる,すなわち既存の高性能ライブラリの再利用性がある.4)計算主体の計算(EP)では現状の広域計算システムで十分に運用できる.5)通信主体の計算(Linpack)では,LAN環境ではサーバの稼働率が性能を支配し,WAN環境では通信性能と設置条件によって性能に与える影響に一定の傾向がある.Rapid increase in speed and availability of network of supercomputers is making high-performance global computing possible,including our Ninf system.However,critical issues regarding system performance characteristics in global computing have been little investigated,especially under multi-client,multi-site WAN settings.In order to investigate the feasibility of Ninf and similar systems,we conducted benchmarks under various LAN and WAN environments,and observed the following results:1)Given sufficient communication bandwidth,Ninf performance quickly overtakes client local performance,2)current supercomputers are sufficient platforms for supporting Ninf and similar systems in terms of performance and OS fault resiliency,3)for a vector-parallel machine (Cray J90),employing optimized dataparallel library is a better choice compared to conventional task-parallel execution employed for non-numerical data servers,4)computationally intensive tasks such as EP can readily be supported under the current Ninf infrastructure,and 5)for communication-intensive applications such as Linpack,server CPU utilization dominates LAN performance,while communication bandwidth dominates WAN performance,and furthermore,aggregate bandwidth could be sustained for multiple clients located at different Internet sites;as a result,distribution of multiple tasks to computing servers on different networks would be essential for achieving higher client-observed performance.
著者
高木 浩光 松岡 聡 中田 秀基 関口 智嗣 佐藤三久 長嶋 雲兵
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.40, no.5, pp.2203-2214, 1999-05-15
参考文献数
23
被引用文献数
1

地球規模の広域分散計算システムを魅力的なものとするためには 不特定の者に対して システムの利用だけでなく応用プログラムの作成をも解放する必要があると考える. その実現のためには 安全性を保証しながら任意のプログラムを実行できる仕組みが必要である. そこで Javaのセキュリテイ機構を活用してこれを実現した 大域的並列計算環境「Ninflet」を提案する. これを用いることで 任意の計算を他人が所有する計算機上でさせることが可能となる. このシステムは 夜間利用されていない計算機を地球の裏側の昼間の地域に貸し出すといった 地球規模の共同利用メタコンピュータシステムを実現するためや また ワークステーションクラスタ上に並列処理環境を構築するためにも利用することのできるものである. 本論文では Ninfletシステムのアーキテクチャを提案するとともに 並列処理環境として利用する場合の予備的な性能評価を行う.To make global-wide distributed computing system attractive, the system should be open to an arbitrary individual not only for its usage but also for construction of wide variety of application programs. For this purpose, the system must supply a secure environment for safely executing arbitrary programs. Our proposed global computing environment "Ninflet" fulfills such a requirement by exploiting the security mechanism of the Java language, allowing computation to occur on machines not owned or administered by the individual invoking the computation. Ninflet realizes a globally-shared metacomputer which would allow "lending" of computing cycles of machines which would be otherwise unused at nights to the other side of the globe, or to simply build a parallel execution environment on a heterogeneous sets of workstation clusters. We present the system architecture of Ninflet and a preliminary performance evaluation when used as a parallel execution environment.
著者
中田 秀基 高木 浩光 松岡 聡 長嶋 雲兵 佐藤 三久 関口 智嗣
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. HPC,[ハイパフォーマンスコンピューティング]
巻号頁・発行日
vol.65, pp.9-14, 1997-03-06
参考文献数
5

ローカルなネットワーク上でのメッセージバッシングライブラリを用いた分散並列計算はすでに広く行なわれている。しかし、ネットワークの高速化によって現実的になりつつある広域ネットワーク上での分散並列計算については、ソフトウェアの枠組が未だ十分に整備されていない。我々は、広域分散並列計算に適した分散計算の枠組として「Ninf」を提案している。Ninfは広域分散環境でのマクロデータフローによる並列実行を支援するシステムで、広域での動的負荷分散とスケジューリングを特徴とする。メッセージパッシングライブラリを用いた手法に比較して(1)広域ネットワークに適した通信パターンを用いる、(2)ユーザにとってプログラミングが容易でかつ再利用性が高い、(3)既存のライブラリの再利用が容易、(4)ネットワーク上の食源の利用が可能、といった特長をもっている。
著者
中田 秀基 高木 浩光 松岡 聡 長嶋 雲兵 佐藤三久 関口 智嗣
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.39, no.6, pp.1818-1826, 1998-06-15
参考文献数
7
被引用文献数
4

ローカルなネットワーク上でのメッセージパッシングライブラリを用いた分散並列計算はすでに広く行われている.しかし,ネットワークの高速化によって現実的になりつつある広域ネットワーク上での分散並列計算については,ソフトウェアの枠組みがいまだ十分に整備されていない,我々は,広域分散並列計算に適した分散計算の枠組みとして「Ninf」を提案している.Ninfは広域分散環境でのマクロデータフローによる並列実行を支援するシステムで,広域での動的負荷分散とスケジューリングを特徴とする.メッセージパッシングライブラリを用いた手法と比較して,(1)広域ネットワークに適した通信パターンを用いる,(2)ユーザにとってプログラミングが容易でかつ再利用性が高い,(3)既存のライブラリの再利用が容易,(4)ネットワーク上の資源の利用が可能,といった特長を持つ.Distributed computing using message passing libraries in a LAN(Local Area Network) environment is already accepted as an effective supercomputing methodology.On the other hand,although distributed computing in WAN(Wide Area Network) environment is becoming practical due to recent development of high-speed network facilities,software framework for supercomputing in WAN is yet to be established.We propose 'Ninf',a distributed computing framework for globally distributed computing environment.Ninf enables parallel computing in WAN based on the macro dataflow model,and facilitates automatic dynamic load distribution and scheduling.Ninf has the following advantages over using existing message passing libraries in WAN supercomputing:(1) communication protocol suited for globally distributed environment,(2) ease of programming (3) reuse of existing libraries,(4) integration with existing data resources on the Internet.
著者
平木 敬 島田 俊夫 関口 智嗣
雑誌
情報処理学会研究報告計算機アーキテクチャ(ARC)
巻号頁・発行日
vol.1992, no.64(1992-ARC-095), pp.113-118, 1992-08-19

命令レベルデータ駆動計算機SIGMA?1におけるコードの最適化の効果を評価する。コードの最適化手法として、ループをアンフォールド実行するために必要な機能を統合化した命令の導入、ループ不変変数の実現を効率化する手法、命令レベルの負荷分散についてデータ駆動計算機SIGMA?1を用いて評価を行なった。つぎに、大規模なプログラムを安全かつ効率良く並列実行するために必要なプログラム文脈に依存する最適化技法として、非同期性と多重代入、資源の回収と再利用、データ配置、大域データに基づく条件分岐などについて述べた。
著者
小川 宏高 松岡 聡 佐藤 仁 高野 了成 滝澤 真一朗 谷村 勇輔 三浦 信一 関口 智嗣
雑誌
研究報告ハイパフォーマンスコンピューティング(HPC) (ISSN:21888841)
巻号頁・発行日
vol.2017-HPC-160, no.28, pp.1-7, 2017-07-19

国立研究開発法人産業技術総合研究所 (以降,産総研) では,平成 28 年度二次補正 「人工知能に関するグローバル研究拠点整備事業」 の一環として,平成 29 年度末に,東京大学柏 II キャンパスに,「AI 橋渡しクラウド (AI Bridging Cloud Infrastructure)」 (以降,ABCI という) の導入を計画している.ABCI は,我が国の人工知能技術開発のためのオープンなリーディングインフラストラクチャの実現を目指し,アルゴリズム (Algorithm),ビッグデータ (Big Data),計算能力 (Computing Power) の協調による,高度な人工知能処理を可能にする大規模かつ省電力なクラウド基盤である.本稿では,ABCI のサーバシステムにフォーカスしつつ,ABCI の概要と,システム設計上の論点と我々が採った方策について紹介する.
著者
武宮 博 田中 良夫 中田 秀基 関口 智嗣
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌コンピューティングシステム(ACS) (ISSN:18827829)
巻号頁・発行日
vol.45, no.11, pp.144-159, 2004-10-15
参考文献数
39
被引用文献数
7

Grid プログラミングモデルの1 つであるGridRPCの参照実装としてNinf-G2の開発を行い,性能を評価した.広域に分散した複数台のクラスタから構成される大規模Grid 環境上でアプリケーションを効率良く実行することを目的とするNinf-G2は,関数ハンドル同時生成機能やリモートオブジェクトを実装することで,遠隔手続き呼び出しにともなう起動コストや通信コストの低減を図るとともに,ハートビート機能や関数ハンドル作成タイムアウト機能,サーバ属性の個別設定機能を提供することで,非均質,不安定で動的に変化するGrid環境への対応を図っている.典型的なタスク並列アプリケーションである気象シミュレーションプログラムを対象に,6台のクラスタから構成されるGridテストベッド上でNinf-G2の性能評価を行った.その結果,個々のタスクの実行時間が十数秒から数十秒程度の比較的粒度の小さいシミュレーションであっても,200台以上のプロセッサを用いて効率的に実行可能であることが分かった.A high performance GridRPC system called Ninf-G2 has been developed and its performance was evaluated. Ninf-G2 aims to enable applications to run efficiently on a large scale Grid environment which consists of clusters widely distributed over a network. It tries to reduce costs for start-up and communication by simultaneous function handles creation function and remote object mechanism. In addition, it tries to cope with heterogeneous, unstable, and dynamically varying grid environment by heart-beat monitoring function, timeout mechanism in creating function handles, and methods to specify server-dependent attributes. Using 6 distributed clusters, performance of Ninf-G2 was evaluated by running an atmospheric simulation program which is a typical task parallel application. Good performance was attained on a grid environment with more than 200 processors even in the case of applications having many small grained tasks.
著者
谷村 勇輔 田中 良夫 横川 三津夫 関口 智嗣
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告計算機アーキテクチャ(ARC) (ISSN:09196072)
巻号頁・発行日
vol.2006, no.20, pp.115-120, 2006-02-27
参考文献数
11

実大三次元振動実験により生成される貴重,かつ膨大なデータを格納するためのデータリポジトリシステム「EDgrid Central」を設計した.EDgrid Central はバックエンドに大容量のストレージと振動実験データの格納用に考案されたデータモデルを実装し,フロントエンドではメタデータによる実験データの検索やデータファイルの一括ダウンロード機能をWeb インタフェースとして提供する.これは米国のNEES プロジェクトで開発されたNEEScentral ソフトウェアをもとに,振動実験のデータを扱うユーザの意見を踏まえて必要な機能の追加・拡張,EDgrid スタイルのデザインへの置き換えを行ったものである.EDgrid Central を運用することで,振動実験データを格納するための半恒久的なリポジトリを確保するとともに,地震工学の研究者がお互いの実験や解析結果を日常的に交換,共有利用する環境を提供することができる.A data repository system, that is called EDgrid Central, is designed for storing huge amount of experiment data by using a 3-D full-scale earthquake testing facility. The EDgrid Central prepares large storage capacity and implements a data modeling for the shake test in the backend. The frontend is a portal for users to retrieve the stored data by meta-data search and bulk download. This system uses the NEEScentral developed by the NEES project in the United States by enhancing search and download functionalities, according to the EDgrid users' requirements. The EDgrid Central allows facility sites to have a permanent repository of the shaking table experiment and it also enables civil engineering researchers to share their data and reports in their daily activities.
著者
西川 武志 長嶋 雲兵 関口 智嗣
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告ハイパフォーマンスコンピューティング(HPC) (ISSN:09196072)
巻号頁・発行日
vol.2002, no.51, pp.43-48, 2002-05-27
被引用文献数
5

Gaussian(http://www.gaussian.com/)は量子化学の専門/非専門を問わず科学者に広く使われる計算科学コードである。従ってGaussianジョブは、殆どのスーパーコンピュータセンターにおいてキューに投入されたジョブの圧倒的多数を占めるが、幾分かは不適切な計算資源、すなわちキューや計算機に投入されたりしている。Gaussianジョブが消費するCPUサイクルは入力パラメータに依存して際立って変化するので、ローカルな計算環境からの最も適切な計算のリソースを選択するすることにはユーザーにとって困難である。我々はグリッド技術を適用することにより高速ネットワーク環境上に「Quantum Chemistry GRID/Gaussian Portal」を構築し、個々のシステム環境の仕様を知らずとも高価な計算資源を能率的に利用することを目指している。「Quantum Chemistry GRID/Gaussian Portal」はWebインターフェイス、メタスケジューラー、計算資源、アーカイブ資源、グリッドインフラウェアから構成されている。Gaussian (http://www.gaussian.com/) is a code widely used in computational chemistry research by quantum and non-quantum chemists. So, Gaussian jobs are the majority of the number of queued, but some are queued inadequate computational resources, queues or machines for the job at almost supercomputer center. Since consuming CPU cycles of Gaussiar jobs vary significantly depending on the input parameter, it is difficult for users to chose the most adequate computational resources from local computing enviroment. By deploying grid technology on a top of high speed network environment. "Quantum Chemistry GRID/Gaussian Portal" attempt efficiently to utilize costly computational resources without knowing the specifications of each system environment. "Quantum Chemistry GRID/Gaussian Portal" consists of Web interface, Meta-schduler, computational resources, archival resources, and Grid Infrawares.
著者
広渕 崇宏 中田 秀基 伊藤 智 関口 智嗣
出版者
情報処理学会
雑誌
情報処理学会論文誌コンピューティングシステム(ACS) (ISSN:18827829)
巻号頁・発行日
vol.3, no.3, pp.248-262, 2010-09-17
被引用文献数
3

ポストコピー型の仮想マシン再配置機構は仮想マシンの実行ホストを素早く切り替えられるため,データセンタの運用効率を向上させるうえで有用な技術であると考えられる.しかしながら,今日一般的に利用できるまでには至っていない.先行研究におけるポストコピー型再配置機構は,既存の仮想マシンモニタ(VMM)への変更が大きく,ゲストOSの改変も必要になる点に問題がある.そこで我々は,既存VMMのへ拡張が単純でゲストOSの改変も不要な,新たなポストコピー型ライブマイグレーション機構を提案する.メモリアクセスのトラップ処理とメモリページのコピー処理をVMMの外部で実装することで,VMMへの変更量を抑えながらポストコピー型再配置を実現する.再配置性能を検証するため,SPECweb2005を用いて評価実験を行った.負荷の高いウェブサーバを実行するVMであっても,1秒以内に実行ホストを切り替えることができた.実行ホスト切替え後の性能低下は限定的であった.プレコピー型再配置に比べて,VMのすべての状態を移動する時間も短縮できた.Post-copy-based VM migration is considered a promising technology for next-generation datacenters; memory pages are transferred after a VM restarts at a destination host, thereby minimizing the time of switching the execution host. Post-copy-based migration mechanisms, however, have not yet been available in industry. Prototype implementations in prior work need major modifications to existing virtual machine monitors (VMMs), and also require special software support in guest operating systems. In this paper, we propose a simple and plain implementation of post-copy-based migration, which is implemented as a lightweight extension to KVM. It supports any guest operating systems without their modifications. The RAM of a migrated VM is mapped to a special character device, which transparently transfers memory pages on demand. Experiments were conducted by using the SPECweb2005 benchmark. A running VM with heavily-loaded web servers was successfully relocated to a destination within one second. Temporal performance degradation after relocation was alleviated by pre-caching memory pages. In addition, for memory intensive workloads, our migration mechanism moved all the states of a VM faster than a pre-copy-based migration mechanism.
著者
中田 秀基 竹房 あつ子 大久保 克彦 岸本 誠 工藤 知宏 田中 良夫 関口 智嗣
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告ハイパフォーマンスコンピューティング(HPC) (ISSN:09196072)
巻号頁・発行日
vol.2006, no.20, pp.217-222, 2006-02-27
被引用文献数
2

グリッド上で複数の資源を同時に確保(コアロケーション)するには,各サイトにおける事前予約が不可欠である.現在計算資源の多くでは,プライオリティと First Come First Servedを組み合わせたスケジューリングポリシが用いられているが,このスケジューリングポリシと事前予約をどのように組み合わせるべきかに関しては,明らかになっていない.われわれは,この問題を検討する研究環境を整備することを目的とし,1) OpenPBSの亜種であるTORQUEのスケジューラモジュールを記述するためのAPIを整備し,2)これを用いて事前予約機能を持つスケジューラモジュールを実装した.さらにWSRFを用いた外部インターフェイスを実装し,Globus Toolkit Ver.4のGRAMと連動したグリッド環境での予約と実行を実現した.While advance reservation is an essential capability for co-allocating several resources on Grid environments, it is not obvious how it can be combined with priority-based First Come First Served scheduling, that is widely used as local scheduling policy today. To investigate this problem, we 1) developped Java API to implement scheduling modules for TORQUE, a variant of OpenPBS, 2) implemented a scheduler module that have advance reservation capability with the API. We also provide an external interface for the reservation capability based one WSRF. Using with job submission module from Globus toolkit 4, users can make reservation for resources and submit jobs over Grid.
著者
中田 秀基 竹房 あつ子 広渕 崇宏 伊藤 智 関口 智嗣
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. CPSY, コンピュータシステム (ISSN:09135685)
巻号頁・発行日
vol.110, no.167, pp.55-60, 2010-07-28
参考文献数
8
被引用文献数
2

データセンターにおける消費電力低減手法の一つとして、低負荷時には仮想計算機群を少数の物理計算機に集中することで、他の物理計算機を低消費電力状態でスタンバイさせておく方法が考えられる。仮想計算機の負荷が上昇した際には、物理計算機をレジュームし、そこに仮想計算機を高速にマイグレーションすることで、仮想計算機のユーザのユーザ体験を損なわずに、消費電力を低減することができる。この方法を実現するには、負荷に応じて仮想計算機の配置を決定(仮想計算機パッキング)する手法が必要である。本稿では、仮想計算機パッキング問題に対して、いくつかの方法でアプローチし、そのパッキングの質と速度に対する評価を行った。具体的には、遺伝的アルゴリズム、0-1整数計画法を用い、グリーディなアルゴリズムであるFFD法と比較した。0-1整数計画法のソルバとしてはオープンソースのGLPKを用いた。評価の結果、以下を確認した。1)遺伝的アルゴリズムおよび0-1整数計画法は最適化に時間がかかり、リアルタイム性が要求される仮想計算機パッキング問題には必ずしもそぐわない。2)FFD法は、使用ノード数の最小化には効果があるが、マイグレーション数が制御できない。3)遺伝的アルゴリズムを、FFD法で導出した解の改良に用いることができる。
著者
早川 潔 関口 智嗣 岩根 雅彦
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告ハイパフォーマンスコンピューティング(HPC) (ISSN:09196072)
巻号頁・発行日
vol.2001, no.77, pp.111-116, 2001-07-25
被引用文献数
2

Beowulf クラスタシステムは 比較的安価でかつ容易に構築できるため 非常に注目を集めており Beowulf クラスタでの通信性能をはじめとする種々の処理性能向上に関する研究が盛んに行われている.また 処理性能の高精度な測定は より正確な評価を可能にし 通信時間の隠蔽などといった並列処理の効率化を可能にする.一般的に処理性能を測定するためには 各ノードの実行開始時刻を正確に揃えなければならない.一般的なBeowulf クラスタでは 各ノードの実行開始時刻を揃えるために MPI などの通信ライブラリのBarrier 関数が用いられる.しかし Beowulf クラスタに実装されるBarrier では ある程度の誤差が生じてしまう.そこで 本稿では PC をベースしたBeowulf クラスタシステ厶(SCCB-Cluster system )における高精度実行時間測定システムの検討を行った.高精度な測定を可能にするために Beowulf クラスタに高速なバリア同期を可能にするSCC ボードを搭載した.また そのSCC ボードの中にクロックカウンタを搭載し 疑似的なグローバルクロックを実装する.性能評価として Beowulf クラスタのcollective 通信性能を測定した.SCC ボードでの高速なバリア同期を用いた実行時間測定値は Ethernet を使用したMPI_Barrier を用いた測定値より 安 定し かつ 短い値を示したものあった.Beowulf cluster consisted of commodity parts,such as PCs and 100base/TX LAN card,is the most remarkable parallel computer system.Collective communications using MPI are the most integral packet forwarding methods on the cluster computing.Accurate performance analysis of collective communication is useful on performance evaluation and prediction of Beowulf cluster system.In order to measure execution time accurately, each node have to take the first step with execution by barrier.But it is difficult for each node to take the first step with execution each other,since it receives the packet indicating barrier completion through Ethernet (i.e.MPI_Barrier)in different time. This paper describes the Beowulf cluster system (SCCB cluster)that allows us to measure execution time accurately.SCC (Synchronization Communication Controller)was implemented in this cluster system.SCC is able to finish executing barrier less than 10us with 32 nodes.As the performance analysis of MPI collective communication using barrier that SCC performs (SCC_Barrier), performance of MPI collective communication of SCC_Barrier is less fluctuation than that of MPI_Barrier.
著者
中田 秀基 草野 貴之 松岡 聡 佐藤三久 関口 智嗣
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告ハイパフォーマンスコンピューティング(HPC)
巻号頁・発行日
vol.1996, no.22, pp.77-82, 1996-03-04
被引用文献数
3

ネットワーク数値情報ライブラリNinf(etwork based Infomation library for High Performance Computin)は、高速なネットワークを前提として、主に数値演算の分野において、計算自体を多くのユーザに提供することを目指したシステムである。本稿では、Ninfシステムを構築する要素の一つであるメタサーバに関して、そのアーキテクチャを示し、簡単な性能予備評価を示す。メタサーバは、サーバとクライアントの間にたちサーバの場所をクライアントに対して隠蔽する役割を果たす。また、メタサーバを用いることにより、簡単な分散並列計算が可能になる。To establish a framework of information sharing in the numerical computation area, we have proposed the Ninf, Network based information library for high performance computing. In this paper, we show a Meta Server architecture, which is a component of the Ninf system. Meta Server stand between the Server and the Client and hides the Server from the Client. It also enables easy distributed concurrent computation.