著者
平田 陽一 松倉 健志 田島 敬史 田中 克己
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
巻号頁・発行日
vol.2000, no.69, pp.137-144, 2000-07-26
被引用文献数
5

従来のWeb検索における適合フィードバックでは,ユーザがサンプルページの内容を見て評価し,その評価をもとに再検索または検索結果の再構成を行なう.その際,ページの評価は「良い」または「悪い」の2種類であった.そのため,従来の適合フィードバックの手法は,「良い」と評価されたページに類似したページを獲得するのには有効だが,ユーザの要求が「この話題についてのより詳しいページが欲しい」などのように複雑になると,十分にユーザの意図を汲み取ることが難しく,うまく機能しないことがあった.そこで,本研究では,単に「良い」または「悪い」の二元論的な評価に基づいて,サンプルページに類似するページを集めるのではなくて,サンプルページと実際に欲しいページの違いを評価として与えることによって,そのような差異を持つページを探してくれるような,意味的な適合フィードバック機構を提案する.ページ間の差異としては,各ページ中の単語数や,お互いのページ内の単語の共起度を用いて,ページ間の情報量や話題の広がりの相対的な差を測定する.In conventional relevance feedback for Web query systems, the user evaluates some sample pages, and then based on that evaluation, the original query is revised, or the query results are reorganized. In that evaluation, sample pages are classified as good or bad. This approach is effective to find pages similar to the pages evaluated as good. In some cases, however, the users want to specify their requirements more specifically, such as, "I want pages discussing this topic in more detail." In the usual relevance feedback, the users cannot express such requirements in the evaluation. In this paper, we propose a framework where the users can express such requirements, which we call semantic relevance feedback. In our framework, the users specify the difference between a sample page and pages they want. We estimate the difference between pages based on the amount of information and the extent of the topic in each page. We measure the former by the number of word occurrences, and measure the latter by the ratio of cooccurrence of words in pages.