- 著者
-
後藤 英昭
阿曽 弘具
- 出版者
- 一般社団法人電子情報通信学会
- 雑誌
- 電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
- 巻号頁・発行日
- vol.78, no.3, pp.465-473, 1995-03-25
- 被引用文献数
-
8
文字領域の抽出は,文書画像に対して文字認識処理を適用する際の,必須な処理である.本論文では,文書画像から文字領域を抽出する新しい手法:区分直線連結法(Linear Segment Linking)を提案する.本提案手法は,文書画像中の区分直線状の要素を文字行と仮定して抽出するもので,文書構造に関する知識を必要とせず,画像のゆがみなどにも耐性があることが示される.本手法では,画像の中間表現として新しく定めた基本矩形を用いるが,これは行方向にぼかしを入れて抽出される定まった幅の矩形(高さは画像に依存する)である.この基本矩形は,外接矩形よりも容易かつ高速な生成が可能なものとなっている.また,文字行抽出処理の段階で行間の結合(ブリッジ)を強制的に切り離す処理を導入している.これによって,文字行間に若干の接触のある文書からも安定な文字行の抽出が可能となることが示される.