著者
天野 富夫
雑誌
全国大会講演論文集
巻号頁・発行日
vol.47, pp.145-146, 1993-09-27

文書画像の構造解析は既存印刷文書をコンピュータに自動入力するための重要な技術であるが、これらの処理においては黒画素の連結成分を追跡して得られた外接矩形の情報が多く用いられている。本稿では黒画素塊の上下境界線分に着目して黒画素塊に対応する矩形を検出する方式を提案する。従来はPC上で黒画素の追跡処理を実用的な速度で行うため、文書画像に閾値以下の短い白ランを黒で置き換えるぼかし処理を適用した後で追跡処理が行われていた。しかしこの手法では異なるカテゴリーに属する黒画素塊(例えば文字と表の枠)がぼかし処理によって連結され一つの外接矩形として検出されてしまうと、以後の解析処理に致命的な悪影響をあたえることが多かった。本方式では上下境界線分にはさまれた部分矩形を中間結果として連結性チェックの対象とすることにより、それらの高さや位置関係あるいは適当な候補領域に対して認識等を行った結果から過剰連結の影響を避けることが可能である。