著者
伊吹 潤 徐国偉 斉藤 孝広 松井 くにお
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL)
巻号頁・発行日
vol.1997, no.4, pp.153-160, 1997-01-20
被引用文献数
5

従来の日本語の校正支援システムでは様々な手がかりをそのままユーザに提示しており,情報の信頼性や誤り可能性の判断の大部分をユーザが行なう必要があった.我々はこれに対して誤り仮説生成部と検証部を独立させた日本語の表記誤りの自動訂正のための新たな枠組を提案する.本構成によって,システムで必要な様々なデータを独立に管理してテキスト分野移行や様々な入力手段への対応の容易さを実現し、又辞書データによる検証を経たデータのみを提示することによって広い範囲の表記誤りに対して信頼性の高い情報を提供している。Although several tools do exist for the detection and correction of Japanese orthodoxical errors, they either deal with too small part of the whole range of errors, or fail to provide reliable error information. We propose a new system for Japanese error correction, which consists of two indepently functioning parts : hypothesis generator and verificator. Hypothesis generator detects possible orthodoxical errors and assumes their original spelling from the input text, while the verificator looks up basic dictionary and word-to-word co-occurence relation to sift out improper hypotheses.
著者
小川 知也 斉藤 孝広 松井 くにお
雑誌
全国大会講演論文集
巻号頁・発行日
vol.52, pp.291-292, 1996-03-06

既存印刷文書を電子ファイリングして活用するために,OCRは有力な手段である.しかし日本語文書を対象とする場合,日本語は文字種が多いことなどから認識誤りを完全に無くすことは困難である.文字認識結果中の候補文字列から最適な単語のパスを探索することによる誤り訂正・指摘方式を開発したので,その概要について述べる.また,文字認識における切り出し誤りへの対応も考慮した拡張形態素解析について論じる.