- 著者
-
吉賀 夏子
只木 進一
- 雑誌
- 情報処理学会論文誌 (ISSN:18827764)
- 巻号頁・発行日
- vol.59, no.2, pp.257-266, 2018-02-15
Web上には,江戸時代以前の書籍である古典籍の書誌および画像データが多数公開されている.これらのデータの活用には,古典籍を構成する序や跋などの情報を含めて,Linked Data形式などへ構造化することが有効である.古典籍の書誌データは専門用語が多く,構造化のためには,一般には専門家の手作業が必要であった.本稿では,形態素解析と注記の記述様式に特化したスクリプトを活用することで,半自動でこうした作業を実施する方法を提案する.また,具体的なコレクションへの適用を通じて,手法の有効性を検証する.提案手法は,コレクションごとに軽微な調整で適用できる手法であり,古典籍の書誌データを構造化するために有効である.