著者
金沢 輝一 高須 淳宏 安達 淳
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
巻号頁・発行日
vol.1998, no.57, pp.165-172, 1998-07-08
参考文献数
12
被引用文献数
4

情報検索においては自然言語の意味曖昧性が大きな問題となっており,ベクトル空間モデル上で問合せ表現のベクトルを拡張するquery expansionなどの手法が存在する.しかし問合せ表現は情報量が小さいために,検索者の意図を汲み取って的確にベクトルを拡張することは難しい.著者らは文書関連性を用いて文書ベクトルを拡張することで検索性能を向上させる手法を提案する.提案手法では検索テーブル作成時に文書関連性に基づいて文書集合を作り,この集合を単位として補う要素を決定することで精度の向上を図る.評価実験として,学術論文に予め付与されているキーワードを情報源として文書間の関連性を抽出,この関連性を元にベクトルを補って,tf・idfモデルやquery expansionとの性能比較を行う.Ambiguity of meaning is a serious problem in information retrieval, and query expansion in the vector space model is one of the typical methods, which expands the query vectors to cope with this problem. However, queries tend to have less information for fitting query vectors to the latent semantics, which are difficult to express in a few query words given by users. We propose a document expansion method which expands the document vectors based on relevance of documents. The proposed method, in which document sets are prepared based on the relevance of documents at the time search table is constructed by adding words for each set, is expected to increase the query precision. In this paper, we evaluate our method through retrieval experiments in which the relevance of documents extracted from scientific papers, and the comparison with tf・idf and query expansion methods is described.

言及状況

はてなブックマーク (1 users, 1 posts)

[あとで読む][自然言語処理][論文]

収集済み URL リスト