著者
松井 くにお 中村 直人 伊吹 潤 徐 国偉
雑誌
全国大会講演論文集
巻号頁・発行日
vol.52, pp.283-284, 1996-03-06

インターネットなどのネットワークの普及により、電子化された情報を発信する機会が増えてきたが、同音異義語の変換誤りなどのいわゆる"ワープロミス"が散見される。こういった誤りの検出技術として、形態素解析や共起関係を利用する方法が提案されているが、いろいろな問題点を含んでおり、解決策とはなっていない。本稿では、同音異義語や同音異字語の綴り誤りを検出するだけでなく、自動訂正するシステムを提案し、その有効性を示す。
著者
伊吹 潤 中村 直人 徐 国偉 松井 くにお
雑誌
全国大会講演論文集
巻号頁・発行日
vol.52, pp.285-286, 1996-03-06

文章中の誤りの検出、訂正を行なう方式として正しい単語情報と共に誤った単語を形態素辞書に登録する方式が知られているが、この枠組では検出できる誤りが狭い範囲(登録されたもの)に限られるという問題点をもつ。カタカナ語句の表記の揺れや漢字同音語誤り等に範囲を限定して一般的な対処が可能なシステムの提案も行なわれているが、表記レベルの誤り全般を統一的に処理できるような枠組は未だない。我々は表記誤り全般を広範囲に検出できるようにするため、混同しやすい単語あるいは文字列同士をグループ化した情報(誤用候補情報)を単語情報とは独立して保持し、一旦正しい単語のみを利用してテキストを形態素解析した後で、これを用いて誤りの検出と誤り内容の推定を行なう仕組み(誤用候補展開)を実現した。ここでは、誤用候補展開部の処理目標とした誤りについて述べ、その処理のための枠組について説明する。
著者
中村 直人 徐 国偉 伊吹 潤 松井 くにお
雑誌
全国大会講演論文集
巻号頁・発行日
vol.52, pp.287-288, 1996-03-06

従来,片仮名表記の揺れ誤りや仮名漢字変換誤りなど単語の綴り誤りに対して,それぞれ校正処理の枠組が提案されている.Joynerではこれらの誤りを単一の枠組で扱うことを試みた.Joynerの処理手順は,文に含まれる各種単語の綴り誤りの検出と候補の推定を行ない,推定した候補を原文の別綴り可能性(綴り曖昧さ)とする.そして,文の綴り曖昧さの中から最尤解を探索し(正解語探索),最尤解の綴りが原文と異なる時に,原文に綴り誤りがあると推定する.綴り曖昧さのある文の最尤解釈の探索は,文字認識の分野で文字切り出し曖昧さの処理として検討され,2端子グラフ(ラティス)の最短経路を求める動的計画法で処理できることが知られている.これをJoynerに適用し,動的計画法の一種であるCYK法で実現した.本稿では,校正支援のためのラティスをCYK法で処理する方法についてJoynerでの実現を中心に報告する.
著者
徐 国偉 伊吹 潤 中村 直人 松井 くにお
雑誌
全国大会講演論文集
巻号頁・発行日
vol.52, pp.289-290, 1996-03-06

ワープロで日本語文書を作成する時に、仮名漢字変換ミスや思い込みなどよく誤りが発生する。Joynerは入力文から誤りを探し出し、正解語辞書を照合することによって誤りを修正する。誤り訂正を行なうためには大量の正解語が不可欠である。われわれは新聞記事のデータベースから一旦正解語候補を抽出して、それに対して絞り込みを行なうことによって正解語辞書を作成した。本論文では、正解語候補の自動抽出と絞り込みによる正解語辞書の作成方法について述べる。