著者
黒田 佳世 榎本 友里枝 高田 雅美 城 和貴
出版者
情報処理学会
雑誌
研究報告数理モデル化と問題解決(MPS) (ISSN:18840930)
巻号頁・発行日
vol.2010, no.35, pp.1-6, 2010-12-09

本稿では,本の見開き画像をテキスト化する際に生じる誤認識を修正する機能をもつポータルサイトを設計する.対象とする画像は,国会図書館が所有する近代書籍のデジタル画像とする.このデジタル画像に対して,近代書籍専用の活字文字認識を適用することによりテキスト化は可能であるが,誤認識が生じる.これを修正するために,デジタル画像とテキスト文書を用いる.提案するポータルサイトでは,テキスト文書と画像データを対応させるメタデータを作成することによって,テキストに対応する画像を表示させることを可能にする.In this paper,we present a design of a portal site which has functions for correcting erratums.These erratums are caused when the facing images,which are owned by Digital Library from Meiji Era in National Diet Library,are transformed into text documents.Although those images can be transformed by using an OCR,which is specialized in early-modern printed books,the OCR infrequently cause erratums.So,to correct them, we take by means of those images and text documents. In this case,we make the metadata by which text can be corresponded to image .