著者
加藤 純 前田 宗則 小沢 年弘
雑誌
研究報告システムソフトウェアとオペレーティング・システム(OS)
巻号頁・発行日
vol.2012, no.8, pp.1-10, 2012-07-25

Twitter や YouTube,Yahoo! Video などの大量データを扱うデータインテンシブな大規模サイトで人気データにユーザーのアクセスが集中すること (データスパイク) によるレスポンス性能の低下が問題になっている.本稿では時間軸に沿って重み付けされた人気度を省メモリで推定することによってデータスパイクの検出を高速に行い,データスパイク時のアクセス頻度の高さによって動的にレプリカ数を調節することでデータスパイクによるレスポンス性能の低下問題を解決する ARD (Adaptive Replication Degree) 機構を提案する.ARD 機構の評価を Michael Jackson の突然死に伴って Wikipedia で発生したデータスパイクを模したワークロードで行ったところ,データスパイクが発生した 5 秒後にはそのスパイクを検出でき,データスパイク時の平均レスポンス時間を 70% 削減できることを確認した.In Internet-scale data-intensive sites (e.g., Twitter, YouTube and Yahoo! Video), extremely concentrated accesses for a piece of popular data, called data spike, cause a high latency problem. This report proposes ARD (Adaptive Replication Degree) to solve such problem. The ARD estimates a time-weighted popularity of data by a memory-efficient manner and quickly detects a data spike through the estimated weighted popularity. When the ARD detects the data spike, it automatically changes the number of replicas of data by access rate of the data spike and levels the concentrated accesses. The evaluation of the ARD is performed by simulating the data spike caused by the sudden death of Michael Jackson at Wikipedia. This result shows that the ARD detects the data spike in five seconds after the rise of the spike and reduces average response time during the data spike by 70%.
著者
熊野 達夫 小沢 年弘
雑誌
研究報告システムソフトウェアとオペレーティング・システム(OS) (ISSN:21888795)
巻号頁・発行日
vol.2016-OS-136, no.2, pp.1-9, 2016-02-22

企業や大学などの組織で仮想デスクトップインフラストラクチャー (VDI) が一般的に使われるようになってきている.VDI では複数のユーザが 1 つのストレージ装置を共有するため,ストレージが性能のボトルネックになる可能性がある.このボトルネックを解消するためには,VDI によるストレージ I/O の特性を知る必要がある.そこで,我々は企業で約 300 ユーザによって大規模に使われている VDI サービスで,サーバとストレージ間のネットワークに流れるデータをキャプチャすることにより,ストレージのトレースを取得した.取得したトレースを,アクセスされるブロックの論理アドレスと時刻の観点で分析した.各ブロックを,アクセス頻度の時間変化の類似性でクラスタリングしたところ,アドレスが連続したブロックが同じクラスタに分類されることが多いことが分かった.また,複数の日にわたってこの傾向が大きくは変化しないことが分かった.この結果から,ブロックごとのアクセス傾向の類似度を利用して効果的に階層制御を行う可能性を見出した.