著者
渡部 啓吾 Danushka BOLLEGALA 松尾 豊 石塚 満
出版者
日本知能情報ファジィ学会
雑誌
知能と情報 (ISSN:13477986)
巻号頁・発行日
vol.23, no.5, pp.739-748, 2011-10-15 (Released:2012-01-11)
参考文献数
15

クエリー拡張や類似検索など,さまざまな情報検索のタスクにおいて,関連語が登録されているシソーラスは必要不可欠な言語資源である.人手で作られたシソーラスであるWordNet やロジェのシソーラスを使っている情報システムは多数存在するが,関連語シソーラスを人手で構築または更新する作業は大変コストがかかるだけでなく,新語や既存の単語の新たな使い方をカバーできないという問題がある.本論文ではウェブを膨大なテキストコーパスとみなし,検索エンジンを通して関連語を抽出するための手法を提案する.提案手法では,ウェブ検索エンジンから得られるスニペットを用い,効率良く関連語を抽出することができる.