著者
中辻 真
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J105-D, no.6, pp.436-446, 2022-06-01

Web上に整備されている大規模な知識ベースに存在するセマンティクスは,個別のサービスに蓄積されているユーザの行動ログの統合分析に活用できる.ユーザ行動は,三つ以上のオブジェクトを含む関係で表現でき(例:“ユーザ”が“ウェブページ”に“タグ付け”するなど)るため,テンソルはユーザ行動を表現するための合理的な方法論を提供する.近年提案されたSemantic Sensitive Tensor Factorization (SSTF) は,オブジェクトの背後にあるセマンティクス(例:アイテムのカテゴリ)を用い,テンソル分解を行い,ユーザー行動を高精度に予測できる.しかし,SSTFは一つのサービスに対するテンソル分解のみを取り扱うため,(1) 異質なサービスのデータセットを同時に扱う場合に起こるバランス問題,及び (2) 観測データが不十分な場合に発生する希薄問題を解決できない.本論文で提案するSemantic Sensitive Simultaneous Tensor Factorization (S3TF) は,(1) 個々のサービスのテンソルを作成し,個別にテンソル分解を実行するのではなく,同時に実行する.これにより,バランス問題に起因する予測精度の低下を回避できる.また,(2) 分散した行動ログの背後にあるセマンティクスを用い,テンソル分解時に意味的なバイアスをサービス間で共有する.これにより希薄問題を回避する.実世界のデータセットを用いた実験により,S3TFは,既存のテンソル分解手法よりも高い予測精度を達成し,また,サービスを跨る暗黙の関係を抽出できることを示した.

言及状況

外部データベース (DOI)

Twitter (1 users, 1 posts, 0 favorites)

収集済み URL リスト