- 著者
-
小川 知也
斉藤 孝広
松井 くにお
- 雑誌
- 全国大会講演論文集
- 巻号頁・発行日
- vol.52, pp.291-292, 1996-03-06
既存印刷文書を電子ファイリングして活用するために,OCRは有力な手段である.しかし日本語文書を対象とする場合,日本語は文字種が多いことなどから認識誤りを完全に無くすことは困難である.文字認識結果中の候補文字列から最適な単語のパスを探索することによる誤り訂正・指摘方式を開発したので,その概要について述べる.また,文字認識における切り出し誤りへの対応も考慮した拡張形態素解析について論じる.