著者
伊東伸泰 丸山 宏
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.33, no.5, pp.664-670, 1992-05-15
被引用文献数
22

著者らは既存の日本語印刷文書をハイパーメディアなどのデータベースに効率よく入力・運用する目的で文書理解システム(DRS:Document Recognition System)を開発中であるが その機能の1つとしてOCRで認識された文字中から日本語文の制約を利用して誤りを検出 オペレータに警告し 可能な場合はより確からしい候補に置き換える後処理を実現した本後処理は日本語辞書と品詞間接続テーブルを参照して文法的に、成立する文字列の候補を生成した後 各単語の品詞 出現頻度 遷移確率 および認識の確からしさに基づいてコストを計算しその値が最良のものから一定値以内の候補パスを選び出すそして各カラムの文字候補について 自分自身を通る候補パスに付随するコストと他の文字を通るパスのそれから確信度を計算し その値により当該候補の入れ替えや オペレータに対する警告を行う実験によれば後処理なしで95%程度の認識率であったデータで認識率が約99%に向上し 検出されなかった(言い換えれば入れ替え 警告のいずれも行われなかった)誤認識文字は02%程度にとどまった候補パスを見出す探索には動的計画法とピームサーチを用いることで 803866(25MHz)のパーソナルコンピュータ上で約27文字/秒の実行速度が得られた

言及状況

はてなブックマーク (1 users, 1 posts)

収集済み URL リスト