著者
松原 靖子 櫻井 保志 Christos FALOUTSOS
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J100-D, no.4, pp.457-471, 2017-04-01

本論文では,大規模オンライン活動データのための非線形解析手法であるECOWEB (Ecosystem on the Web)について述べる.本研究では,“Xbox”, “PlayStation”, “Wii”等のオンライン検索キーワードの出現件数に関する時系列データが与えられたとき,それらのキーワード間の潜在的な関連性や競合性,そして季節性等の重要なパターンを自動抽出することを目的とする.より具体的には,オンラインユーザ活動の推移パターンを,自然界の生態系における種内・種間競争として捉えることで,潜在的なユーザ資源(ユーザの興味,時間等)を各アクティビティ(Xbox等のキーワード)がどのように共有,あるいは競合しているかを非線形動的システムとして表現する.実データを用いた実験では,ECOWEB が様々なオンライン活動における長期的な非線形パターンや季節性等の重要なトレンドを発見し,更に,長期的な将来予測を高精度に行うことを確認した.
著者
川畑 光希 松原 靖子 本田 崇人 今井 優作 田嶋 優樹 櫻井 保志
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第34回 (2020) (ISSN:27587347)
巻号頁・発行日
pp.4K2GS303, 2020 (Released:2020-06-19)

顧客生涯価値(LTV)は顧客評価における重要な指標であり,LTVを正確に予測することで顧客に対しより適切なマーケティングを行うことが可能になる.本稿では,購買ログデータを対象とし,顧客ID,商品ID,時間の組みで表されるイベントシーケンスから潜在的な購買特性を発見し,それらに基づくLTV予測を行うための手法を提案する.実データを用いた実験では,提案手法が与えられた購買ログの中から有用な購買特性を発見し,従来手法よりも高い精度でLTV予測を行うことを確認した.
著者
櫻井 保志
出版者
日本基礎心理学会
雑誌
基礎心理学研究 (ISSN:02877651)
巻号頁・発行日
vol.35, no.2, pp.129-135, 2017-03-31 (Released:2017-06-07)
参考文献数
8

Big time-series data have been generated in various applications including sensor networks, financial systems, online documents, medical information, web access records, social networking services, etc. How can we efficiently and effectively find typical patterns? How can we statistically summarize all the sequences, and achieve a meaningful segmentation? What are the major tools for forecasting and outlier detection? This paper summarizes our recent work, which includes: SpikeM that analyzes the rise and fall patterns of influence propagation in social networking services, TriMine for fast mining and forecasting of complex time-stamped events, AutoPlait for automatic mining of co-evolving multidimensional time sequences, EcoWeb as ecology-inspired nonlinear dynamical systems for pattern extraction from online activities, FUNNEL for automatic mining of spatially co-evolving epidemics, CompCube for non-linear mining of competing local activities, and RegimeCast for real-time forecasting of data streams.
著者
小杉 尚子 櫻井 保志 山室 雅司 串間 和彦
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.45, no.1, pp.333-345, 2004-01-15
被引用文献数
6 7

本論文では,我々が研究開発しているハミングを用いた音楽検索システム"SoundCompass"を,カラオケの選曲システムとして実用化するために考案した技術について述べ,それらの有効性を定量的に評価する.このシステムを実用化するにあたって,一般ユーザの使用により,様々なハミングに柔軟に対応することが必要となった.データベース・サイズの増大に対応できるように,蓄積コストや検索速度の改善も必要となった.本論文では様々なハミングに対応するために,これまでの手法では検索できなかったハミングについてその原因を明らかにし,それらを解決するために部分特徴ベクトルの導入,部分ハミング片間OR検索方式の導入,半テンポ曲/倍テンポ曲の重複登録の導入を提案する.一方,検索対象曲数の増加にともなう音楽データベースの大規模化に対して,曲内での繰返しによる特徴ベクトルの冗長性を手がかりにしたデータベース・サイズの縮小を提案する.これらの技術を導入することで,新しいSoundCompassは実用範囲内の検索速度を保ちつつ,20 000曲を超えるデータベースに対して84.2%の検索精度を達成し,従来の我々のシステムと比較して,約20%の向上が可能となった.This paper describes techniques incorporated into SoundCompass, a query-by-humming system, to enable it to be put to practical use as a karaoke song selection system. Quantitative evaluations of the techniques are also provided. Solutions for variations in hummed tunes by general users are required to make the system practical. Moreover, improvements in both the cost of storing a large number of songs in a database and retrieval speed efficiency are also required to deal with database size expansion. In this paper, we analyze hummed tunes which cannot be retrieved by traditional techniques. According to the analysis, a partial feature vector, an OR retrieval among query keys, and double registration of songs whose tempo is doubled/halved are proposed to deal with the diversity among hummed tunes. We also propose a method to reduce database size based on the repetitive structure of songs to solve the problem of increasing database size as the number of songs stored in the database becomes larger. The new SoundCompass system achieves 84.2% retrieval accuracy, which is about 20% more than that of the previous system, for a database that stores over 20,000 songs, while maintaining the applicable retrieval time required for practical use.
著者
岸野 泰恵 櫻井 保志 亀井 剛次 柳沢 豊 前川 卓也 岡留 剛
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告モバイルコンピューティングとユビキタス通信(MBL) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.18, pp.127-134, 2008-02-27

本研究では, 数多くのセンサノードからなる大規模センサネットワークのための効率的なデータ収集機構を提案する.収集したデータは,実世界の情報のリアルタイムなコンテンツ化に用いることを想定している.提案する機構では,データが発生してから基地局に到着するまでの遅延を抑制することを目的に,階層的にクラスタを作成してデータを収集する.クラスタリングは,クラスタ内の通信が他のクラスタと重複する度合いを指標として行い,クラスタ内のノードの個数や階層数は,データの発生量から遅延を見積もって決定する.本稿では,通信方式と,提案するクラスタリング手法について述べる.また,各階層ごとにデータを集めることで基地局にデータが到達するまでの時間を短縮できることを示す.The data aggregation method for a large-scale sensor network proposed here aims to reduce the communication delay from the generation of a sensor event to the arrival of the data to a base station. The method adopts hierarchical clustering whose criterion is the degree of duplication of wireless communication area among clusters. The clustering parameters such as the number of hierarchies and those of nodes in a cluster are determined by estimating the amount of data. Analyses of a tree-structural communication model show the method using the hierarchical clustering enables to reduce the communication delay.
著者
岸野 泰恵 櫻井 保志 亀井 剛次 柳沢 豊 前川 卓也 岡留 剛
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告ユビキタスコンピューティングシステム(UBI) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.18, pp.127-134, 2008-02-27
被引用文献数
1

本研究では, 数多くのセンサノードからなる大規模センサネットワークのための効率的なデータ収集機構を提案する.収集したデータは,実世界の情報のリアルタイムなコンテンツ化に用いることを想定している.提案する機構では,データが発生してから基地局に到着するまでの遅延を抑制することを目的に,階層的にクラスタを作成してデータを収集する.クラスタリングは,クラスタ内の通信が他のクラスタと重複する度合いを指標として行い,クラスタ内のノードの個数や階層数は,データの発生量から遅延を見積もって決定する.本稿では,通信方式と,提案するクラスタリング手法について述べる.また,各階層ごとにデータを集めることで基地局にデータが到達するまでの時間を短縮できることを示す.The data aggregation method for a large-scale sensor network proposed here aims to reduce the communication delay from the generation of a sensor event to the arrival of the data to a base station. The method adopts hierarchical clustering whose criterion is the degree of duplication of wireless communication area among clusters. The clustering parameters such as the number of hierarchies and those of nodes in a cluster are determined by estimating the amount of data. Analyses of a tree-structural communication model show the method using the hierarchical clustering enables to reduce the communication delay.
著者
川畑 光希 松原 靖子 櫻井 保志
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.11, no.1, pp.1-10, 2018-04-17

本論文では,時系列データストリームを対象とした自動特徴抽出手法であるStreamScopeについて述べる.StreamScopeはIoTアプリケーションやWebアクセス履歴等の大規模なデータストリームから,(a)自動的に時系列パターンを発見し,(b)それらの特徴を統計的に要約しながら,データストリームを構成するすべてのパターンを明らかにする.また,(c)計算時間はデータストリームの長さに依存せず,ストリームマイニングに適した高速な処理を行う.実データを用いた実験では,提案手法がデータストリームに含まれる特徴的なパターンの種類と変化点を自動的かつ正確にとらえることを確認した.さらに,提案手法はオンライン処理でありながら高精度であり,計算時間について大幅な性能向上を達成していることを明らかにした.
著者
本田 崇人 松原 靖子 根山 亮 櫻井 保志
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.9, no.3, pp.1-13, 2016-09-30

本論文では,車両走行データのための自動パターン検出手法であるTRAILMARKERについて述べる.TRAILMARKERは,位置情報をともなう様々な車両走行センサデータが与えられたときに,おのおのの道路や場所における車両走行の特徴を抽出し,それらの情報を統計的に要約,表現する.すなわち,走行データに基づく高度な道路地図情報を提供する.具体的に提案手法は,(a)車両走行データをテンソルとして表現した後,そこから複数の部分シーケンスに共通する主要な走行パターンを抽出する.(b)その際の計算量は入力データのサイズに対して線形である.さらに,最も重要な点として,(c)提案手法はパラメータに依存しない.すなわち,事前情報の付与またはパラメータのチューニングを行うことなく,大規模車両走行データの特徴抽出とパターン検出を自動で行うことができる.実データを用いた実験ではTRAILMARKERが様々な車両走行データの中から主要パターンや外れ値シーケンスを効果的かつ効率的に検出することを確認した.
著者
豊田 真智子 櫻井 保志 石川 佳治
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D, 情報・システム (ISSN:18804535)
巻号頁・発行日
vol.94, no.7, pp.1058-1070, 2011-07-01
被引用文献数
1

本論文では,データストリームにおけるcross-similarityの問題を定義する.本論文の目的は,データストリームから類似する部分シーケンスペアを検出することである.シーケンス間の類似度を測定する距離尺度には,時間軸上でのスケーリングを考慮することができるダイナミックタイムワーピング(DTW:Dynamic Time Warping)距離を利用する.我々の提案するCrossMatchは,厳密にDTWに基づいた手法であり,データストリーム処理に適したワンパスアルゴリズムである.DTWを用いた純粋なアルゴリズムと比べて,CrossMatchは計算コストとメモリ使用量の大幅な低減化を実現する.理論的な分析を行い,提案アルゴリズムが精度を犠牲にすることなく類似する部分シーケンスペアを検出することを示す.また,実データと人工データを用いた実験から,CrossMatchがインクリメンタルにcross-similarityを検出することが確認された.
著者
櫻井 保志
出版者
一般社団法人情報処理学会
雑誌
情報処理 (ISSN:04478053)
巻号頁・発行日
vol.47, no.7, pp.755-761, 2006-07-15
被引用文献数
4

ユビキタスコンピューティングという言葉があるように,今後センサの小型化や低価格化によって,大規模なセンサネットワークがさまざまなところで構築されるようになると考えられる.その際に,大量のセンサから送られてくる時系列データ,すなわちデータストリームを高速に分析するストリームマイニング技術は非常に重要になってくる.ストリームマイニングの研究には,探索,トレンド検出,予測などさまざまな取り組みがあるが,本稿では,各々の取り組みから代表的な技術を紹介する.さらに,最新の取り組みとして,ストリームからの遅延相関検出技術を紹介する.この技術によって,たとえば類似したトレンドのストリームを出力するセンサ群をリアルタイムに検出したり,あるいは故障によって異常値を出力するセンサを即座に発見することが可能になる.
著者
櫻井 保志
雑誌
情報処理
巻号頁・発行日
vol.47, no.7, pp.755-761, 2006-07-15

ユビキタスコンピューティングという言葉があるように,今後センサの小型化や低価格化によって,大規模なセンサネットワークがさまざまなところで構築されるようになると考えられる.その際に,大量のセンサから送られてくる時系列データ,すなわちデータストリームを高速に分析するストリームマイニング技術は非常に重要になってくる.ストリームマイニングの研究には,探索,トレンド検出,予測などさまざまな取り組みがあるが,本稿では,各々の取り組みから代表的な技術を紹介する.さらに,最新の取り組みとして,ストリームからの遅延相関検出技術を紹介する.この技術によって,たとえば類似したトレンドのストリームを出力するセンサ群をリアルタイムに検出したり,あるいは故障によって異常値を出力するセンサを即座に発見することが可能になる.
著者
前川 卓也 柳沢 豊 岸野 泰恵 石黒 勝彦 亀井 剛次 櫻井 保志 岡留 剛
出版者
情報処理学会
雑誌
研究報告ユビキタスコンピューティングシステム(UBI) (ISSN:09196072)
巻号頁・発行日
vol.2010, no.57, pp.1-8, 2010-03-19
被引用文献数
1

本稿では,カメラ,マイク,加速度センサなどのセンサ搭載する手首装着型センサデバイスを用いて人の日常行動を認識する手法および,そのデバイスの設計について述べる.センサデバイスは,ユーザの手のひらの周辺の領域を撮影するように設置されたカメラを備えることを特徴とし,これにより,「コーヒーを作る」,「水やりをする」 などのモノを用いた行動の認識が可能となる.既存のウェアラブルセンサを用いた行動認識の研究では,加速度センサやマイクのみしか用いていなかったため,このような行動の認識は困難だった.また,提案デバイスはカメラやマイクを備えるため,ユーザのプライベートな生活を画像や音声として記録してしまうという,プライバシーの問題をもつため,本稿では,原画像や音声を必要としない行動認識手法を提案する.さらに,評価実験において,提案手法およびデバイスの有効性を確かめた.This paper describes a method that recognizes activities of daily living (ADLs) by employing a wrist worn sensor device with such various kinds of sensors as a camera, a microphone, and an accelerometer, and also describes the design of the wrist worn device. Specifically, the device captures a space around the user's hand by the camera to recognize ADLs that involve the manual use of objects such as making tea or coffee and watering plant. Existing wearable sensor devices equipped only with a microphone and an accelerometer cannot recognize these ADLs without object embedded sensors. We also propose an ADL recognition method that takes privacy issues into account because the camera and microphone can capture aspects of a user's private life. Furthermore, we experimentally confirmed the effect of our proposed device and method.
著者
櫻井 保志 Christos Faloutsos 山室 雅司
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J92-D, no.3, pp.338-350, 2009-03-01

近年,データストリーム処理に関する研究が盛んに行われている.本論文は,ダイナミックタイムワーピング(DTW:Dynamic Time Warping)に基づいて,与えられた問合せシーケンスと類似した部分シーケンスをデータストリームから検出することを目的とする.DTWは時間軸上でのスケーリングを考慮した距離尺度であり,様々な分野で広く使われているが,主として有限長の蓄積データに用いられてきた.しかし,ネットワーク分析,センサ監視など,データ量が多く,緊急性が要求されるような最近のアプリケーションでは,すべてのデータを蓄積してから処理することが困難である.本論文では,このような問題を解決する手法であるSPRINGを提案する.更に理論的な分析を行い,精度を犠牲にしないにもかかわらず計算コストがデータストリームの長さに依存せず一定であることを証明する.様々な実データと人工データを用いた実験を行い,SPRINGがデータストリームから正確に部分シーケンスを検出し,そしてナイーブな手法と比較して大幅な性能向上を達成していることを明らかにした.