- 著者
-
打田 智子
加藤 誠
- 雑誌
- 情報処理学会論文誌データベース(TOD) (ISSN:18827799)
- 巻号頁・発行日
- vol.16, no.2, pp.1-15, 2023-04-14
情報検索システムのクエリ自動補完において,現在主流の手法では,クエリ補完候補を生成するため,過去に蓄積された膨大なクエリログを必要とする.本論文では,専門ドメイン検索システムなど,クエリログが入手しづらい状況下において,入手可能な他のクエリログおよびその文書コレクションと,ターゲットとする文書コレクションから,クエリ補完候補を生成するアプローチについて述べる.具体的にはまず,他のクエリログのクエリ中に出現する単語N-gramのN-gram確率と,対応する文書コレクション中のN-gram確率との比率(「クエリらしさ」を表現する係数)を推定する回帰モデルを構築する.次に,得られた回帰モデルをターゲットとする文書コレクションに適用することで,実際のクエリ補完候補を生成するN-gramモデルを構築する.実験により,提案手法は,他のクエリログのみ,またはターゲットとする文書コレクションのみを用いて構築したN-gramモデルよりも,ユーザクエリの予測タスクにおいて良い性能を与えることが示された.