著者
井上文雄 宇野篤也 塚本俊之 松下聡 末安史親 池田直樹 肥田元 庄司文由
雑誌
研究報告ハイパフォーマンスコンピューティング(HPC)
巻号頁・発行日
vol.2014-HPC-146, no.4, pp.1-5, 2014-09-25

「京」 では現在,通常は小中規模のジョブ (36,864 ノード以下) を実行し,大規模ジョブ (36,865~82,944 ノード) は特定の期間 (以下,大規模ジョブ実行期間) に実行するという運用を行っている.通常の運用では 「京」 の消費電力は契約電力内に収まっているが,大規模ジョブ実行期間において契約電力を超過する事例が発生した.頻繁な契約電力の超過は電力契約の見直し等につながり,運用に及ぼす影響は無視できないものである.そこで,これを回避するために,投入予定の大規模ジョブを消費電力の観点で事前に審査することにした.すなわち,過去の動作実績等から推測した大規模ジョブ実行時の消費電力が運用上の上限を超えないことが確認されたジョブのみ投入を許可することにした.加えて,消費電力を 24 時間監視できる体制の構築,及び最大電力量を超過した際のジョブ停止プロセスの整備など運用方法の変更を実施した.本稿では,これらの対策と今後の取り組みについて報告する.