著者
前田 直俊 大山 聡
出版者
一般社団法人 情報科学技術協会
雑誌
情報の科学と技術 (ISSN:09133801)
巻号頁・発行日
vol.67, no.2, pp.73-78, 2017-02-01 (Released:2017-02-01)

過去20年にわたって世界各国でウェブアーカイブが行われ,法制度の整備,技術開発,人材育成など様々な分野で発展を遂げてきた。とりわけ技術開発においては,IIPCを中心とした国際的な取組の成果が顕著で,その成果は今日におけるウェブアーカイブ技術の基盤を形成している。本稿では,それらウェブアーカイブ技術の中核であるクローラHeritrix,保存ファイルフォーマットWARC,閲覧ソフトWaybackを取り上げ,各国機関における導入状況,開発経緯や仕組みを紹介する。また,NutchWAXやSolrなどの全文検索エンジン,メタデータによる組織化,アーカイブ間の連携を目指すMementoプロジェクトについても概要を紹介する。