- 著者
-
山名 早人
- 雑誌
- 情報処理学会研究報告データベースシステム(DBS)
- 巻号頁・発行日
- vol.2004, no.45(2004-DBS-133), pp.107-110, 2004-05-14
インターネット上のWWWサーバから発信される情報量は膨大であり、2004年4月時点で、テキストデータだけでも92.5億ページと推測される。また、2002年?2003年の増加傾向をみると、Webページは今後も1年間におよそ10億ページずつ増加を続けると予想される。このような膨大なWebページには、人間が一生かかっても学ぶことのできない情報、知識、ノウハウが凝縮されていると言っても過言ではない。本稿では、このような膨大なWebデータをどのように収集し更新すべきか、そして、このような膨大なWebデータをどのように有効活用すべきかについて、いくつかの研究事例を紹介すると共に、新しい利用法について考える。