- 著者
-
金堀 利洋
鈴木 昌和
- 出版者
- 一般社団法人電子情報通信学会
- 雑誌
- 電子情報通信学会技術研究報告. WIT, 福祉情報工学 (ISSN:09135685)
- 巻号頁・発行日
- vol.105, no.66, pp.7-10, 2005-05-12
Webアクセシビリティの意識が浸透しつつある一方で, 情報がPDFとして提供される流れが加速している.配布されているPDFには文字情報が、人が読む順序と異なる順番に埋め込まれていて、視覚障害者がその内容を読み取る事は困難な場合が多い.また, 数式の情報が読み取れる形で入っていることはほとんど無い.今回, 特に数式や表を含んだ科学技術文書を対象とし, PDFに既に埋め込まれている文字情報を抽出し, 一方で, PDFを画像として認識し, 認識結果と抽出した文字情報を組み合わせ, 質の高い, アクセシブルな文書情報をPDFから取り出すことを目的とするシステムのプロトタイプを示す.