著者
横山 重俊 浜元 信州 長久 勝 藤原 一毅 政谷 好伸 竹房 あつ子 合田 憲人
雑誌
研究報告インターネットと運用技術(IOT) (ISSN:21888787)
巻号頁・発行日
vol.2020-IOT-51, no.8, pp.1-7, 2020-08-27

データ駆動型科学研究分野で研究データの再利用を進めるためには,研究データの公開だけではなく,論文成果につながる実験結果にたどり着くまでの実験プロセス(実験手順や実験環境構築手順)を公開し共有する必要がある.これらが揃うことで,第三者である別の研究者がいつでも研究データを再利用し,研究の再現検証が可能となる.さらに,そのオリジナル研究に加えて自らの研究を派生させることがスムーズにできるようになる.本稿では,その実験プロセスをコミュニティで共有する方式に関する検討内容と今回提案する方式について述べ,その実装例および研究再現例についても報告する.
著者
竹房 あつ子 小川 宏高 松岡 聡 中田 秀基 高木 浩光 佐藤三久 関口 智嗣 長嶋 雲兵
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.39, no.6, pp.1827-1838, 1998-06-15
参考文献数
14

広域ネットワークの整備につれ,高性能広域分散計算を実現する試みが我々のNinfを含めていくつか行われている.しかしこのような広域計算システムの,特にWANにおいて複数のクライアントが複数のサイトに分散している状況下での性能特性に関する議論は十分になされていない.本稿では,Ninfおよび類似のシステムの実現可能性を調査するため,LAN/WAN環境でLinpack/EPベンチマークを実施し,次のような結果を得た.1)十分なバンド幅があれば,Ninfを用いた方がLocal実行するより高速になる.2)既存の高性能計算機は性能や耐久性の点で広域計算システムの運用に十分なプラットフォームである.3)ベクトル並列計算機(Cray J90)では,高性能並列ライブラリが有効利用できる,すなわち既存の高性能ライブラリの再利用性がある.4)計算主体の計算(EP)では現状の広域計算システムで十分に運用できる.5)通信主体の計算(Linpack)では,LAN環境ではサーバの稼働率が性能を支配し,WAN環境では通信性能と設置条件によって性能に与える影響に一定の傾向がある.Rapid increase in speed and availability of network of supercomputers is making high-performance global computing possible,including our Ninf system.However,critical issues regarding system performance characteristics in global computing have been little investigated,especially under multi-client,multi-site WAN settings.In order to investigate the feasibility of Ninf and similar systems,we conducted benchmarks under various LAN and WAN environments,and observed the following results:1)Given sufficient communication bandwidth,Ninf performance quickly overtakes client local performance,2)current supercomputers are sufficient platforms for supporting Ninf and similar systems in terms of performance and OS fault resiliency,3)for a vector-parallel machine (Cray J90),employing optimized dataparallel library is a better choice compared to conventional task-parallel execution employed for non-numerical data servers,4)computationally intensive tasks such as EP can readily be supported under the current Ninf infrastructure,and 5)for communication-intensive applications such as Linpack,server CPU utilization dominates LAN performance,while communication bandwidth dominates WAN performance,and furthermore,aggregate bandwidth could be sustained for multiple clients located at different Internet sites;as a result,distribution of multiple tasks to computing servers on different networks would be essential for achieving higher client-observed performance.
著者
竹房あつ子 中田秀基 池上努 田中良夫
出版者
一般社団法人情報処理学会
雑誌
研究報告ハイパフォーマンスコンピューティング(HPC)
巻号頁・発行日
vol.2013, no.20, pp.1-6, 2013-07-24

階層型タスク並列処理は,タスクの再実行や冗長実行により耐障害性を備えたプログラムが設計できるため,ポストペタスケール高性能計算における有望なプログラミングモデルの 1 つと考えられている.我々は,耐障害性を備えたアプリケーションプログラムの開発を支援にする耐障害アプリケーションフレームワーク Falanx を提案している.このようなアプリケーションフレームワークは,計算に必要となるデータを障害から保全するデータストア機構と計算ノードの健全性を監視しつつ適切に計算を実行する資源管理機構からなる.これらを,ポストペタスケール計算機環境においてスケーラブルでかつ,それら自身が耐故障性を持つように設計・実装する必要がある.本研究では,耐障害アプリケーションフレームワークのポストペタスケール計算機環境での性能特性を検証して技術的課題を明らかにすることを目的とし,試験実装となるパーシステントストレージを利用した高可用分散協調スケジューラを設計・開発する.本スケジューラは既に実装を進めている資源管理機構と新たに追加したデータストア機構で構成され,Apache ZooKeeper と Apache Cassandra を用いて実装することで耐障害性を実現する.本スケジューラを用いた予備実験から,処理中に計算ノードが落ちてしまった場合も,自動的にタスクが再実行されアプリケーションプログラムが継続実行できることを確認した.
著者
中田 秀基 竹房 あつ子 大久保 克彦 岸本 誠 工藤 知宏 田中 良夫 関口 智嗣
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告ハイパフォーマンスコンピューティング(HPC) (ISSN:09196072)
巻号頁・発行日
vol.2006, no.20, pp.217-222, 2006-02-27
被引用文献数
2

グリッド上で複数の資源を同時に確保(コアロケーション)するには,各サイトにおける事前予約が不可欠である.現在計算資源の多くでは,プライオリティと First Come First Servedを組み合わせたスケジューリングポリシが用いられているが,このスケジューリングポリシと事前予約をどのように組み合わせるべきかに関しては,明らかになっていない.われわれは,この問題を検討する研究環境を整備することを目的とし,1) OpenPBSの亜種であるTORQUEのスケジューラモジュールを記述するためのAPIを整備し,2)これを用いて事前予約機能を持つスケジューラモジュールを実装した.さらにWSRFを用いた外部インターフェイスを実装し,Globus Toolkit Ver.4のGRAMと連動したグリッド環境での予約と実行を実現した.While advance reservation is an essential capability for co-allocating several resources on Grid environments, it is not obvious how it can be combined with priority-based First Come First Served scheduling, that is widely used as local scheduling policy today. To investigate this problem, we 1) developped Java API to implement scheduling modules for TORQUE, a variant of OpenPBS, 2) implemented a scheduler module that have advance reservation capability with the API. We also provide an external interface for the reservation capability based one WSRF. Using with job submission module from Globus toolkit 4, users can make reservation for resources and submit jobs over Grid.
著者
中田 秀基 竹房 あつ子 広渕 崇宏 伊藤 智 関口 智嗣
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. CPSY, コンピュータシステム (ISSN:09135685)
巻号頁・発行日
vol.110, no.167, pp.55-60, 2010-07-28
参考文献数
8
被引用文献数
2

データセンターにおける消費電力低減手法の一つとして、低負荷時には仮想計算機群を少数の物理計算機に集中することで、他の物理計算機を低消費電力状態でスタンバイさせておく方法が考えられる。仮想計算機の負荷が上昇した際には、物理計算機をレジュームし、そこに仮想計算機を高速にマイグレーションすることで、仮想計算機のユーザのユーザ体験を損なわずに、消費電力を低減することができる。この方法を実現するには、負荷に応じて仮想計算機の配置を決定(仮想計算機パッキング)する手法が必要である。本稿では、仮想計算機パッキング問題に対して、いくつかの方法でアプローチし、そのパッキングの質と速度に対する評価を行った。具体的には、遺伝的アルゴリズム、0-1整数計画法を用い、グリーディなアルゴリズムであるFFD法と比較した。0-1整数計画法のソルバとしてはオープンソースのGLPKを用いた。評価の結果、以下を確認した。1)遺伝的アルゴリズムおよび0-1整数計画法は最適化に時間がかかり、リアルタイム性が要求される仮想計算機パッキング問題には必ずしもそぐわない。2)FFD法は、使用ノード数の最小化には効果があるが、マイグレーション数が制御できない。3)遺伝的アルゴリズムを、FFD法で導出した解の改良に用いることができる。