- 著者
-
富田 準二
竹野 浩
- 出版者
- 一般社団法人情報処理学会
- 雑誌
- 情報処理学会研究報告情報学基礎(FI)
- 巻号頁・発行日
- vol.1998, no.109, pp.17-24, 1998-11-30
WWW上での検索システムのように,検索対象が大規模で雑多なものとなり,また,検索キーとして単語列だけではなく文や文書を指定できるようになると,適合度の判定を正確に行なうことは難しくなる.本研究では,グラフモデルという新しい検索モデルを提案する.このモデルでは,検索キーおよびそれぞれの検索対象文書から,単語の重要度をノードの重みとし,単語間の関連度をリンクの重みとした主題グラフを作成し,これら主題グラフ間の類似度に基づき適合度を判定する.また,単なる単語の出現頻度情報ではなく単語間の関連度情報から単語の重要度を決定する手法を提案する.本手法を用いた検索システムを構築し,ベンチマークを用いて検索精度の評価を行なう.Precise document ranking is difficult for a search system, especially when documents are gathered from huge and various databases such as WWW, or when it uses sentences as a query phrase. We propose a new search model, Graph-Model. In this model, query phrase and each document is translated into a subject graph regarding every word's weight as its node's weight and relation between words as its link's weight, and the document ranking is evaluated by similarities between these graphs. We also propose a new method to calculate the word's weight using the relation between words not the frequency of a word. And we describe an experimental result using a benchmark data.