- 著者
-
森俊二
大津展之
- 雑誌
- 情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM)
- 巻号頁・発行日
- vol.1977, no.34(1977-CVIM-015), pp.1-12, 1977-11-22
対象とするパターンの持つ情報がその形にあり、濃度の微妙な変化にはないような比較的単純な場合には、画面全体をまず二値化することが、それに続く処理の簡略化ばかりでなく、対象を切り出す又は強調するという意味においても、非常に重要である。実際、文字読取装置では、二値化が必ずといってよいほど行なわれている。しかし、この問題は最っとも良く利用している文字認識技術の分野では、Bartzの論文以外ほとんど正面から取り上げて議論されていない。一方画像のほうでは、この問題は比較的良く取り上げられて、今まで種々の方法が発表されてきている。多分この様な状況は、文字の場合には、濃淡がはっきりしている対象を選べる事と、第一義的に認識アルゴリズムに研究の興味があるということ、それに実用装置を作る立場からすれば二値化の前処理はできるだけ単純にすませる必要のあった事が原因になっていると思われる。勿論上述の事は一般的傾向を示すもので、郵便番号読取機などは例外である。一方画像のほうは自然に与えられるものが多く、しかも、まず認識の第一ステップとして対象を切り出すということが重要課題となるので、二値化問題は技術的にも学問的にも取り上げられてきたと思われる。しかし文字認識技術の分野でも、認識アルゴリズムがかなりの水準に達してきて、それと共に必然的にかなり自由な対象を処理する事が要求されるようになった。また使用用紙にしても必ずしもOCR用紙でなく上質紙の使用がユーザーから要求されるようになってきた。この様な背景から、一番最初に問題になった二値化の問題に回帰する必要に迫られたのである。しかし再びこの問題に帰って見ると、それは認識の本質的問題と深いかかわりあいを持ち困難な問題である事があらためて認識させられる。以下、文字、画像データ(線図形)を対象として、二値化問題を認識問題として見直し、今まで開発された手法を含めて、二値化手法の総括的な検討を試みる。