著者
山添隆文 栄藤稔 吉村健 辻野孝輔
雑誌
画像の認識・理解シンポジウム(MIRU2011)論文集
巻号頁・発行日
vol.2011, pp.409-415, 2011-07-20

本稿では,重みつき有限状態トランスデューサ(WFST)を用い,ノイズ領域が文字列として誤検出されることが課題となる情景画像からの日本語語彙検出手法を提案する.提案手法では,情景画像から網羅的な文字候補を抽出し,それらすべての組み合わせを表現したWFST と,大規模な語彙データセットから辞書を構成するWFSTとを合成することより,最終的な語彙検出結果を得る.これにより,辞書に含まれない文字候補の組み合わせとなるノイズ領域を除去することが可能となる.また,情景画像からの文字候補の抽出において,画像における位置情報を保持したままWFST を生成するため,同一の画像領域から最適な語彙を検出することができる.日本語を含む情景画像のデータセットにより検証を行い,ノイズ領域を除去しつつ日本語の語彙を検出できることを確認した.