著者
皆川 明洋 藤井 勇作 武部 浩明 藤本 克仁
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.106, no.301, pp.17-22, 2006-10-13
被引用文献数
4

内容が共通する未知フォーマットの帳票画像から対象データを抽出する方式として、帳票上の文字列の意味とそれらの関係を表す論理構造を認識する一方式を提案する。本方式は、論理要素とその関係の可能性を表現した共通論理構造および帳票画像を入力とし、おのおのの論理要素に対して帳票画像中の文字列を対応付けることで、論理構造を安定的に認識する。本方式の特長は、文字列情報とその位置情報とに基づいて、論理要素との対応関係と論理要素に対応させたときの文字列間の関係とを確率的に表現することで、与えられた共通論理構造の論理要素の関係に対応した直感的な確率グラフを構成し、これに対して確率伝搬法から得られた周辺事後確率に基づいて論理要素に文字列を対応付けることによって、レイアウトに依存せずに論理要素と文字列の対応付けを可能にする点である。本方式により、多様なレイアウトや複雑な論理構造に対応可能で、文字列の内容や位置の推定誤りにも強い論理構造認識を実現する。本方式の有効性を三つの帳票種に対する評価実験により確認した。
著者
勝山 裕 武部 浩明 黒川 浩司 齊藤 孝広 直井 聡
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.88, no.8, pp.1740-1749, 2005-08-01
被引用文献数
2

文書管理システムにおいて, OCR結果の候補文字情報と, キーワード領域の推定を使い, 通常のテキスト検索エンジンで高精度に文書画像を検索できる技術を提案する. この手法では, 文書画像は最初に通常のOCRで文字認識される. 次に, OCRの出力したテキストから, 形態素解析によりキーワード領域が推定される. 候補文字ラティスがこの領域から求められ, 未登録語単語領域ではk-th DP処理により, 名詞単語領域では更に単語辞書との整合により, 候補文字ラティスから文字列が抽出される. 最後に, 通常のテキスト検索エンジンによる高精度な検索を可能にするために, 抽出された文字列は通常のOCRの出力したテキストに追加される. 49枚のOHP文書画像を対象にした検索実験では, 検索精度は, 通常のOCRの出力したテキストのみで検索再現率90.1%, 適合率100%であったが, 提案手法では再現率98.2%, 適合率100%を達成した. また, 処理時間は通常のOCR処理とほぼ変わらず, テキスト量もOCRの出力したテキストの約6倍程度に収まった.