著者
保坂 大樹 河部 瞭太 山下 遥 後藤 正幸
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.60, no.8, pp.1390-1402, 2019-08-15

近年,消費者のWebサイト閲覧行動は重要なマーケティング分析の対象となっている.サイトの閲覧行動を分析することで,サイト間の関係性やユーザの嗜好を把握し,Web広告の掲載やメールの配信などのマーケティング施策の最適化や効率化が可能となるためである.しかし,蓄積されたWeb閲覧履歴データ中のサイトやユーザの関係性は複雑であり,サイト単位やユーザ単位の分析が困難となる場合が多い.したがって,そのような状況においても適用可能,かつ有効な分析手法が望まれている.本研究では,単語の意味分析において良い性能を示しているWord2vecとその拡張モデルに基づき,各サイトや各ユーザをそれぞれ意味空間上の多次元正規分布として表現するとともに,意味空間上のサイトやユーザの関係性に基づいて分析を行うための手法を提案する.学習された意味空間上の表現を用いた分析により,単純な閲覧,被閲覧の関係ではなく,閲覧行動の背後に存在するサイトやユーザの潜在的な特性や関係性を把握することが可能となる.また,提案手法では,サイトやユーザが持つ性質の広がりが多次元正規分布の分散行列として学習される.最後に,提案手法の有効性を検証するために,実際の閲覧履歴データ分析に適用し,得られる結果に関する考察を与える.さらに,分散行列をサイトの閲覧者の多様性,またはユーザの嗜好の多様性として解釈し,より詳細な分析が行えることを示す.