- 著者
-
坪内 佑樹
脇坂 朝人
濱田 健
松木 雅幸
小林 隆浩
阿部 博
松本 亮介
- 雑誌
- 情報処理学会論文誌 (ISSN:18827764)
- 巻号頁・発行日
- vol.62, no.3, pp.818-828, 2021-03-15
クラウド上のシステムの大規模化にともない,CPU利用率などのシステムの各構成要素の状態を把握するために,大量の時系列データを保存する必要がある.そのために,時系列データを保存するデータベースにはデータの挿入処理とデータ保存の効率化と挿入スケールアウト性の向上が求められる.既存技術は,挿入スケールアウト性を高めるために広く利用されているディスクベースの分散KVS(Key Value Store)を利用する.しかし,ランダムI/Oが低速なディスクへ書き込むという前提があることから,メモリ上でキーを整列させながら挿入可能な平衡木が利用されるが,キーの挿入時に系列数に対して対数時間を要する.すべてのデータをメモリ上に保持するメモリベースKVSであれば,ハッシュ表に基づくデータ構造の利用により定数時間の挿入が可能となる.しかし,メモリは容量単価が大きいことから,データを長期間保存するには不向きである.本論文では,メモリベースKVSとディスクベースKVSを階層化する高性能な時系列データベースHeteroTSDBを提案する.HeteroTSDBは,メモリベースKVS上に系列名をキーとして,系列本体をバリューとしたハッシュ表を構成することにより,系列数に対して定数時間でデータを挿入する.加えて,系列を格納するキーにTTL(Time To Live)によるタイマを設定し,古くなったデータを系列単位でまとめてディスクベースKVSへ移動させることにより,データ保存のための容量単価を低減させている.実験の結果,ディスクベースKVSを利用した既存の時系列データベースであるKairosDBと比較し,HeteroTSDBは3.98倍の挿入スループット向上を達成した.