著者
坪内 佑樹 脇坂 朝人 濱田 健 松木 雅幸 小林 隆浩 阿部 博 松本 亮介
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.62, no.3, pp.818-828, 2021-03-15

クラウド上のシステムの大規模化にともない,CPU利用率などのシステムの各構成要素の状態を把握するために,大量の時系列データを保存する必要がある.そのために,時系列データを保存するデータベースにはデータの挿入処理とデータ保存の効率化と挿入スケールアウト性の向上が求められる.既存技術は,挿入スケールアウト性を高めるために広く利用されているディスクベースの分散KVS(Key Value Store)を利用する.しかし,ランダムI/Oが低速なディスクへ書き込むという前提があることから,メモリ上でキーを整列させながら挿入可能な平衡木が利用されるが,キーの挿入時に系列数に対して対数時間を要する.すべてのデータをメモリ上に保持するメモリベースKVSであれば,ハッシュ表に基づくデータ構造の利用により定数時間の挿入が可能となる.しかし,メモリは容量単価が大きいことから,データを長期間保存するには不向きである.本論文では,メモリベースKVSとディスクベースKVSを階層化する高性能な時系列データベースHeteroTSDBを提案する.HeteroTSDBは,メモリベースKVS上に系列名をキーとして,系列本体をバリューとしたハッシュ表を構成することにより,系列数に対して定数時間でデータを挿入する.加えて,系列を格納するキーにTTL(Time To Live)によるタイマを設定し,古くなったデータを系列単位でまとめてディスクベースKVSへ移動させることにより,データ保存のための容量単価を低減させている.実験の結果,ディスクベースKVSを利用した既存の時系列データベースであるKairosDBと比較し,HeteroTSDBは3.98倍の挿入スループット向上を達成した.

言及状況

Twitter (23 users, 23 posts, 107 favorites)

前職在籍時から続けていたHeteroTSDBの論文が情報処理学会ジャーナルに出版されました。共著のみなさまありがとうございました。 @ast_j @itchyny @songmu @tzkb @hirolovesbeer @matsumotory https://t.co/gGLHtNSsPo https://t.co/V9olBK8lc1 https://t.co/qFEl7wUxDQ

収集済み URL リスト