著者
川原 一真 山本 幹雄
雑誌
全国大会講演論文集
巻号頁・発行日
vol.54, pp.21-22, 1997-03-12
被引用文献数
2

ワードプロセッサ等を用いて作成された日本語文書に含まれる各種の表記誤りを、計算機により校正するために様々な手法が提案されている。誤り検出ルールを用いた手法では、誤り検出ルールを人手によって作成しなくてはならず、手間がかかる。また、辞書を用いた形態素解析システムを使って、入力文を形態素解析した結果と準備しておいた形態素辞書とを比較する手法では、使用した形態素解析システムが誤った文を無理矢理正しい形態素の連続としてしまう可能性が強い。そこで我々は、文に対して辞書を用いない方法で分割位置を与えるシステムを用いて、正しい文から成ると考えられるコーパスから単語辞書を構築し、その辞書との比較によって表記誤りを検出する手法を提案する。一定の基準で入力文を分割するシステムを用いるため、英文スペルチェッカーで実用化されている手法が流用できるのではないかという期待ができる。また、正しい文からなるコーパスを用いれば、誤り検出用の辞書が自動で得られるというのも利点である。なお今回の実験で、本手法によってミスタイプとかな漢字変換誤りの一部を検出できるということが確かめられた。