著者
願 力栩 田中 直樹 金子 豊久 Haralick R. M.
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.80, no.10, pp.2696-2704, 1997-10-25
被引用文献数
30

文字は主に細長い線分で構成されることから, 画像中に存在する文字領域は「細長い領域」を検出することにより抽出が可能と考えられる. 本論文では, まず数学モルフォロジーを用いて濃淡画像における領域の幅(文字線幅)を得る方式について述べ, 更にそれに基づく文字領域抽出方式について述べる. 本方式は, 多様な背景部をもつ画像に適用可能であり, 背景部と文字領域が複雑に入り組むような場合にも単純な画像の場合と全く同等に処理できる. 雑誌の表紙画像を実験対象として文字列抽出実験を行った結果, 白黒濃淡画像に対して81%, カラー画像では95%の抽出結果を得ることができた. また, 解像度の関係で, 今回用いた最小の構造化要素と同等の文字サイズしかもたない小さな文字を除くと, それぞれ92%, 100%の抽出結果を得ることができた.