著者
樋渡仁 吉川美奈子 岩村相哲
雑誌
デジタルプラクティス (ISSN:21884390)
巻号頁・発行日
vol.5, no.4, pp.325-332, 2014-10-15

遠隔拠点にあるクラウドコンピューティング環境(以下,単にクラウド環境)を構築・運用していく上で,装置の故障・障害にどのように対処するかは,運用コストの最小化において重要である.特に,遠隔拠点に作業員が常駐せず定期的に現地を訪問し保守作業する前提では,構築時に系全体に冗長性を持たせ,装置の故障・障害が発生した場合には,遠隔から現用系より待機系に切り替えることで,当該装置の修理・復旧は現地での定期保守時に行う運用が典型的である.このような遠隔クラウド環境の設計では,構築時に系全体が保持する信頼度に対し,定期保守回数を最小化する必要があり,本論文は,クラウド環境の信頼性モデルにより,運用コストが最小化された設計を実現できることを示す.特に,クラウド環境の立ち上げ時には,サーバの故障率が,故障率曲線における初期故障期から偶発故障期へ至る過程で大きく変動するため,本手法の適用においては,定期保守の間隔を初期故障期と偶発故障期で使い分けることが有用であることを示す.
著者
樋渡仁 岩村相哲 新井克也
雑誌
デジタルプラクティス
巻号頁・発行日
vol.2, no.3, pp.227-234, 2011-07-15

本論文では,我々のクラウドコンピューティング環境において,多数のHDDが故障した事例を取り上げ,故障実績を調査した.この故障実績をもとに,HDDの寿命分布を求め,代表的な寿命分布をあてはめた.赤池の情報量基準(AIC)を用い,適合度を評価すると,ワイブル分布(形状母数α=1.508)が最も良くあてはまることが分かった.この結果から,交換用HDDの必要数を推定する手法を提案した.さらに,RAIDコントローラが保持するHDDの状態とHDDの平均寿命について調査した.コマンド中断数,メディア故障数,接続失敗数とHDDの平均寿命に有意な相関関係があり,幾つかの仮定の下で我々のHDDの故障物理が速度過程モデルに従うことが分かった.この結果から,メンテナンス時にHDDの余命を推定し,予防的に交換する手法を提案した.