著者
浅野 三恵子 下辻 成佳
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.80, no.1, pp.131-138, 1997-01-25
被引用文献数
8

入力された帳票が既登録帳票のどのフォーマットに最も類似しているかを識別するシステムにおいて, セル (枠) に記入された文字や, コピーによって起こるかすれやつぶれ, スキャナ入力による傾きやゆがみなどに影響されずに, 帳票種別を識別する手法を提案する. 帳票文書は一般に, 水平・垂直線分に囲まれたセルで表現できる. セルの中心点をそのセルの代表点とした場合に, 帳票識別は入力画像から得られる点と登録されている帳票上の点とのマッチングの問題として考えることができる. 本論文では, この点マッチングを2次元ハッシュテーブルを用いて実現する手法を提案する. これにより入力画像上の点の揺らぎに対してロバストな帳票識別処理が実現でき, 登録帳票数が増加しても識別に要する時間はある程度一定に抑えることができる. また, 帳票文書同士の類似度によりシステムに登録されている帳票相互の類似性を数値化することができ, 登録帳票が指定された際にシステムの識別能力を予測できる.