著者
坂下 幸徳
雑誌
情報処理
巻号頁・発行日
vol.62, no.8, pp.d33-d56, 2021-07-15

ショッピングサイトや地図サービスなどのWebサービスでは,利用者からのアクセス増減が激しく,バージョンアップによる機能追加やバグ修正も高頻度に行われる.このような特徴を持つWebサービスでは,機能単位に細分化しアプリケーションを分割するアーキテクチャのマイクロサービスが浸透している.これにより,Webサービス全体を変更せず特定のアプリケーションのリソースの増強やバージョンアップを行うことができる.この細分化されたアプリケーションの実行環境としてCPUやメモリなどのリソースの集約率の高さや増強のしやすさからコンテナが注目されている.しかし,マイクロサービスでは,機能単位に細分化されるため,コンテナ数が増加する傾向がある.この増加するコンテナを管理するためコンテナオーケストレーションKubernetesが普及している.Kubernetesは,コンテナのリソースを容易に増減させるスケール機能,障害のセルフヒーリング,Webサービスを無停止でバージョンアップするローリングアップデートなどを有している.このKubernetesの導入により,コンテナの管理負荷の軽減は見込める.しかし,複数Kubernetesを有する大規模コンテナ環境では,Kubernetes自身の管理やこれを構成するコンピュート・ネットワーク・ストレージのインフラ管理が複雑になり管理者の負荷が増加してしまう.本稿では,大規模コンテナ環境としてヤフー(株)にて運用しているKubernetes as a Serviceについて,アーキテクチャと運用実績から得られた知見を報告する.このKubernetes as a Serviceは,2020年12月時点で204,980個以上のコンテナ,860クラスタ以上のKubernetesが稼働している.このような大規模コンテナ環境により,コンテナを使わずVMのみでアプリケーションの実行環境を構築した場合と比較し,コンピュート・ネットワークリソースは約86.4%の集約効果があった.さらに,Kubernetesを使い複数Kubernetesを自律管理する方式にて開発し管理者間のコミュニケーションでのリソース調整を削減するインフラ構成とすることで,管理者の負荷の軽減効果があった.
著者
坂下 幸徳 東条 敏 敷田 幹文
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.56, no.3, pp.767-776, 2015-03-15

データセンタの管理者を支援する研究として障害発生時に障害原因を特定する障害原因解析技術が登場してきている.この障害原因解析技術を使うためにはサーバ,ストレージ,スイッチなどの構成情報が必要となるが,近年,大規模化,複雑化,さらにはクラウド化が進むデータセンタでは,構成情報の取得が困難になり,適用範囲が狭くなってきている.そこで,本論文では,サーバ,ストレージ,スイッチなどの機器が出力するログファイルを使い,統計的推論方式で構成情報を推定する方式を提案する.統計的推論方式としては,代表的な方式である隠れマルコフモデルとベイズ推定を用いる.これにより,障害原因解析技術の適用範囲を拡大を狙う.本提案方式の試作システムによる実験の結果,最大83%の正解率による構成情報の推定に成功した.