著者
松原 靖子 櫻井 保志 Christos FALOUTSOS
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J100-D, no.4, pp.457-471, 2017-04-01

本論文では,大規模オンライン活動データのための非線形解析手法であるECOWEB (Ecosystem on the Web)について述べる.本研究では,“Xbox”, “PlayStation”, “Wii”等のオンライン検索キーワードの出現件数に関する時系列データが与えられたとき,それらのキーワード間の潜在的な関連性や競合性,そして季節性等の重要なパターンを自動抽出することを目的とする.より具体的には,オンラインユーザ活動の推移パターンを,自然界の生態系における種内・種間競争として捉えることで,潜在的なユーザ資源(ユーザの興味,時間等)を各アクティビティ(Xbox等のキーワード)がどのように共有,あるいは競合しているかを非線形動的システムとして表現する.実データを用いた実験では,ECOWEB が様々なオンライン活動における長期的な非線形パターンや季節性等の重要なトレンドを発見し,更に,長期的な将来予測を高精度に行うことを確認した.
著者
櫻井 保志 Christos Faloutsos 山室 雅司
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J92-D, no.3, pp.338-350, 2009-03-01

近年,データストリーム処理に関する研究が盛んに行われている.本論文は,ダイナミックタイムワーピング(DTW:Dynamic Time Warping)に基づいて,与えられた問合せシーケンスと類似した部分シーケンスをデータストリームから検出することを目的とする.DTWは時間軸上でのスケーリングを考慮した距離尺度であり,様々な分野で広く使われているが,主として有限長の蓄積データに用いられてきた.しかし,ネットワーク分析,センサ監視など,データ量が多く,緊急性が要求されるような最近のアプリケーションでは,すべてのデータを蓄積してから処理することが困難である.本論文では,このような問題を解決する手法であるSPRINGを提案する.更に理論的な分析を行い,精度を犠牲にしないにもかかわらず計算コストがデータストリームの長さに依存せず一定であることを証明する.様々な実データと人工データを用いた実験を行い,SPRINGがデータストリームから正確に部分シーケンスを検出し,そしてナイーブな手法と比較して大幅な性能向上を達成していることを明らかにした.