著者
三宅 悠介 松本 亮介
雑誌
研究報告インターネットと運用技術(IOT) (ISSN:21888787)
巻号頁・発行日
vol.2018-IOT-42, no.2, pp.1-7, 2018-06-21

EC サイトの商品種類増大に伴う情報過多問題を解決するため,利用者の要求を満たす商品を自動的に提案する機能が EC サイトにとっての関心事となる.大規模 EC サイトで商品を提案するために扱う特徴量は大規模かつ高次元ベクトルの集合となるため,類似度の比較は精度と計算量を抑えた近似解を用いなければならない.商品を自動的に提案する機能には,可用性を担保しつつ,提案内容の的確さと充分な応答速度が求められる.本報告では,大規模 EC サイトで商品を提案することを想定して,精度と速度を両立した分散可能な近似近傍探索エンジン Sanny を提案する.Sanny は,検索質問データ (クエリ) に対する高次元ベクトル集合の近傍探索結果の上位集合が,クエリと高次元ベクトル集合を任意の次元数で等分した部分ベクトル単位で近傍探索した結果と類似しやすいことに着目して,提案すべき商品の近傍探索を部分ベクトル単位での探索に分解することで分散処理可能にし,その探索結果の和集合である近傍候補から再度近傍探索を行うことにより,全体として高速に近似近傍探索を行える.実験では,従来の近似近傍探索に対する速度並びに精度面での性能比較について評価を行う.

言及状況

Twitter (5 users, 5 posts, 9 favorites)

(2) Sanny: 大規模ECサイトのための精度と速度を両立した分散可能な近似近傍探索エンジン ◯三宅 悠介, 松本 亮介 (ペパボ研究所) https://t.co/IfyFJA7vE4
(2) Sanny: 大規模ECサイトのための精度と速度を両立した分散可能な近似近傍探索エンジン ◯三宅 悠介, 松本 亮介 (ペパボ研究所) https://t.co/i8R8XE7GSo

収集済み URL リスト