- 著者
-
菅原 一秀
- 雑誌
- 全国大会講演論文集
- 巻号頁・発行日
- vol.53, pp.137-138, 1996-09-04
- 被引用文献数
-
1
視覚障害者が簡単に操作でき、日常的な印刷情報にアクセスすることのできる文字認識システムの開発を行なっている。出力は合成音声によるので、文書の内容に素早くアクセスするには文書の論理構造に基づいた構造化が必要となる。また、表題や、ページ番号などは本文と独立にヘッダ、フッタなどに記載されているのでこれらの主に物理的配置に基づいた構造の抽出及びそれへのアクセスが問題となる。本稿では再帰的X-Yカットを用いた文字列の物理的配置の解析手法によるヘッダ、フッタなどの物理的情報の抽出、及び行の端点の並びからのパラグラフ、見出しなどの論理構造の抽出について報告する。