著者
麻田 治男 黒沢 由明 下辻 成佳
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会ソサイエティ大会講演論文集
巻号頁・発行日
vol.1995, pp.310-311, 1995-09-05

パターン認識の中でも文字認識は最も古くから実用化が進んでいる.文字認識の応用システムとしては汎用のOCR(optical Character Recognition)装置があり,この国内市場は93年度で約300億円,台数にして1万数千台に達している(矢野経済研究所調査).文字認識のもう一つの応用としては郵便物自動区分機があり,近年,手書き漢字認識による宛名読み取り区分機が実用化されている.この二つを見ると,ずいぶんと実用化が進んでいるようであるが,日本語ワードプロセッサの市場(年間約3千億円)と比べると,実用化の度合いは小さいといえる.文書・文字認識と類似技術である図面認識についても第二世代に入って既存図面の入力システムが電力会社などで実用に共されているが,まだ,市場規模を云々するほどは普及していない.また,オンライン文字認識は携帯情報機器などのペン入力に用いられ,期待されてはいるが,仮想キーボード入力のような代替手段に比べて優位な位置は占めていない.このように文書・文字認識の技術はそこそこの実用化はなされているが,長年にわたって伸び悩んでいるというのが実情である.一方では,文書・文字認識に関する国際会議やワークショップが新たに発足するなど,国際的な研究活動の高まりを見せており,社会の真のニーズに沿った研究の方向性を見極める必要がある.本稿は「認識技術の実用化を阻むもの」という大テーマの中で,文書・文字認識について応用範囲を拡大するために何をすべきかを述べる.
著者
浅野 三恵子 下辻 成佳
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.80, no.1, pp.131-138, 1997-01-25
被引用文献数
8

入力された帳票が既登録帳票のどのフォーマットに最も類似しているかを識別するシステムにおいて, セル (枠) に記入された文字や, コピーによって起こるかすれやつぶれ, スキャナ入力による傾きやゆがみなどに影響されずに, 帳票種別を識別する手法を提案する. 帳票文書は一般に, 水平・垂直線分に囲まれたセルで表現できる. セルの中心点をそのセルの代表点とした場合に, 帳票識別は入力画像から得られる点と登録されている帳票上の点とのマッチングの問題として考えることができる. 本論文では, この点マッチングを2次元ハッシュテーブルを用いて実現する手法を提案する. これにより入力画像上の点の揺らぎに対してロバストな帳票識別処理が実現でき, 登録帳票数が増加しても識別に要する時間はある程度一定に抑えることができる. また, 帳票文書同士の類似度によりシステムに登録されている帳票相互の類似性を数値化することができ, 登録帳票が指定された際にシステムの識別能力を予測できる.