- 著者
-
伊吹 潤
中村 直人
徐 国偉
松井 くにお
- 雑誌
- 全国大会講演論文集
- 巻号頁・発行日
- vol.52, pp.285-286, 1996-03-06
文章中の誤りの検出、訂正を行なう方式として正しい単語情報と共に誤った単語を形態素辞書に登録する方式が知られているが、この枠組では検出できる誤りが狭い範囲(登録されたもの)に限られるという問題点をもつ。カタカナ語句の表記の揺れや漢字同音語誤り等に範囲を限定して一般的な対処が可能なシステムの提案も行なわれているが、表記レベルの誤り全般を統一的に処理できるような枠組は未だない。我々は表記誤り全般を広範囲に検出できるようにするため、混同しやすい単語あるいは文字列同士をグループ化した情報(誤用候補情報)を単語情報とは独立して保持し、一旦正しい単語のみを利用してテキストを形態素解析した後で、これを用いて誤りの検出と誤り内容の推定を行なう仕組み(誤用候補展開)を実現した。ここでは、誤用候補展開部の処理目標とした誤りについて述べ、その処理のための枠組について説明する。