著者
松岡 聡 實本 英之 遠藤 敏夫 佐藤 仁 丸山 直也 滝澤 真一朗 佐藤 賢斗 Leonardo Bautista Gomez Jens Domke
出版者
東京工業大学
雑誌
基盤研究(S)
巻号頁・発行日
2011-04-01

エクサ(10の18乗)フロップス・10億並列のエクサスケール・スーパーコンピュータ実現には、規模の増大による故障率の増加に対応する必要がある。このための耐故障性基盤を確立することを目的として耐故障にかかわる複数の要素を対象とした複合的数理モデルの提案とそれを用いた軽量かつ高度な耐故障化手法を提案・評価した。また、開発したシステムの一部についてはオープンソースでの公開を行っている。
著者
合田 憲人 大澤 清 大角 知孝 笠井 武史 小野 功 實本 英之 松岡 聡 斎藤 秀雄 遠藤 敏夫 横山 大作 田浦 健次朗 近山 隆 田中 良夫 下坂 久司 梶原広輝 廣安 知之 藤澤克樹
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告ハイパフォーマンスコンピューティング(HPC) (ISSN:09196072)
巻号頁・発行日
vol.2006, no.87, pp.49-54, 2006-07-31
被引用文献数
3

本稿では,2005年12月から2006年5月にかけて実施されたGrid Challenge in SACSIS2006において使用されたグリッド実験環境の構築・運用事例を報告する.Grid Challengeは,大学,研究所が提供する複数の計算資源からなるグリッド実験環境上で,参加者がプログラミング技術を競う大会であり,今大会では1200CPU超の計算資源からなるグリッド実験環境が運用された.本稿では,実験環境ハードウェアおよびソフトウェアの仕様を紹介するとともに,ユーザ管理,ジョブ管理,障害対応といった運用事例についても報告する.This paper presents a case study to operate the Grid testbed for the Grid Challenge in SACSIS2006. The Grid Challenge is a programming competition on a Grid testbed, which is organized by multiple computing resources installed in universities and laboratories. In the last competition, the Grid testbed with more than 1200 CPUs was operated. The paper shows hardware/software specifications of the Grid testbed, and reports experience of the operation, which includes accounting, job management, and troubleshooting.