著者
堀 憲太郎 大石 哲也 峯 恒憲 長谷川 隆三 藤田 博 越村 三幸
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.56, pp.81-88, 2008-06-12

本稿では,ユーザのクエリから,その意図に沿った拡張クエリを作成する際に,Web 上で最大の百科事典である Wikipedia を用いるシステムを提案する.Wikipedia からの拡張クエリの抽出には,関連単語提案アルゴリズム[1]を用いる.関連単語提案アルゴリズムとは,あるキーワードとそれに関連するテキストが与えられた時,テキスト内で出現する単語間の距離に着目して,与えられたキーワードに関連し尚且つ重要と思われる単語を抽出するアルゴリズムである.このシステムを Web 検索時に用いることにより,クエリ拡張し,ユーザの目的とする文書を見つけるための支援技術とすることを目的としている.In this paper, we propose a method to extend the original query by applying a related word extraction algorithm to Wikipedia that is an encyclopedia. The algorithm extracts words related to given key words from any text and calculates a score for each extracted word according to distance between words in the text. The method helps users to obtain their desired documents in web search by extending a query with highly scored words.