- 著者
-
浅田 伸彦
岩村 雅一
黄瀬 浩一
- 出版者
- 一般社団法人電子情報通信学会
- 雑誌
- 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
- 巻号頁・発行日
- vol.110, no.467, pp.183-188, 2011-03-03
本稿では,環境中のあらゆる文字・単語を認識する「全方位認識」の実現のために,厳しい射影歪みに対応する手法について検討する.我々は実時間認識可能,レイアウトフリー,射影歪みに頑健といった3つの要件を満たすカメラベースの単語認識手法を提案している.この手法は斜め45度から撮影した文字を認識できる頑健さを持つが,前述の全方位認識に際しては,射影歪みに対する更なる頑健性が求められる.そこで本稿では,前述の単語認識手法の文字認識誤りをオープンソースのスペルチェッカであるGNU Aspellを利用して補正する.その際,Aspellが持つ音素の類似性に基づくMetaphoneという仕組みを文字誤認識傾向に基くMetashapeに置き換える.提案手法を用いて実験を行った結果,文字が書かれた紙面に対して撮影角度が20度のときに単語認識精度には最大で約24%から約74%の向上が見られた.