- 著者
-
吉賀 夏子
只木 進一
- 雑誌
- 情報処理学会論文誌 (ISSN:18827764)
- 巻号頁・発行日
- vol.59, no.2, pp.257-266, 2018-02-15
Web上には,江戸時代以前の書籍である古典籍の書誌および画像データが多数公開されている.これらのデータの活用には,古典籍を構成する序や跋などの情報を含めて,Linked Data形式などへ構造化することが有効である.古典籍の書誌データは専門用語が多く,構造化のためには,一般には専門家の手作業が必要であった.本稿では,形態素解析と注記の記述様式に特化したスクリプトを活用することで,半自動でこうした作業を実施する方法を提案する.また,具体的なコレクションへの適用を通じて,手法の有効性を検証する.提案手法は,コレクションごとに軽微な調整で適用できる手法であり,古典籍の書誌データを構造化するために有効である.A large amount of bibliographic data and images of Japanese historical rare books, published during the Edo period and before, have been accessible recently on the Web. For utilization of those data, it is effective to convert information including book parts such as preface and epilogue into well-formed data format like Linked Data. Such conversion, in general, has required handworks by persons with special knowledge. This paper proposes a new semi-automatic method for this task, where the method employs morphological analysis tools and scripts specialized to formats in bibliographic notes. The method is evaluated by applying it to some collections. The method can be applied to a collection with small amount of tunings, and is effective to formalize bibliographic data of Japanese historical rare books.