- 著者
-
服部 元
武吉 朋也
小野 智弘
滝嶋 康弘
- 出版者
- 一般社団法人電子情報通信学会
- 雑誌
- 電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション (ISSN:09135685)
- 巻号頁・発行日
- vol.109, no.390, pp.13-18, 2010-01-18
- 被引用文献数
-
1
本研究では,特定のテーマに関連するノウハウ情報を効率的に収集する「ノウハウ検索」手法を提案する.既存の検索エンジンにおいては,一般的に大量の検索結果が得られる.ここで,クエリが「富士山の標高」のような,検索結果上位の数文書程度を閲覧すれば十分な回答が得られるタイプの検索であれば,問題はない.一方,クエリが「おいしいカレーの作り方」のような多様なノウハウの収集を目的とするタイプの検索の場合は,なるべく多くのWeb文書を閲覧する必要があり,検索結果を順次閲覧する方法では,時間や労力の点で限界がある.本稿では,なるべく少ない閲覧数でより多くのノウハウを集める効率的な情報収集の手法を提案する.具体的には,単語の概念関係と出現頻度を利用してノウハウに関連する単語をWeb文書から抽出し,未読のノウハウ情報を含むWeb文書を優先的にユーザに提示する.評価実験を行い,単語の概念関係を導入することでノウハウに関連する単語を多く抽出できること,および,未読のノウハウ情報を優先的に提示することで,一般の検索結果を閲覧するよりも効率的にノウハウ情報を閲覧できることを示した.