著者
打田 智子 加藤 誠
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.16, no.2, pp.1-15, 2023-04-14

情報検索システムのクエリ自動補完において,現在主流の手法では,クエリ補完候補を生成するため,過去に蓄積された膨大なクエリログを必要とする.本論文では,専門ドメイン検索システムなど,クエリログが入手しづらい状況下において,入手可能な他のクエリログおよびその文書コレクションと,ターゲットとする文書コレクションから,クエリ補完候補を生成するアプローチについて述べる.具体的にはまず,他のクエリログのクエリ中に出現する単語N-gramのN-gram確率と,対応する文書コレクション中のN-gram確率との比率(「クエリらしさ」を表現する係数)を推定する回帰モデルを構築する.次に,得られた回帰モデルをターゲットとする文書コレクションに適用することで,実際のクエリ補完候補を生成するN-gramモデルを構築する.実験により,提案手法は,他のクエリログのみ,またはターゲットとする文書コレクションのみを用いて構築したN-gramモデルよりも,ユーザクエリの予測タスクにおいて良い性能を与えることが示された.