著者
脇田 早紀子
雑誌
全国大会講演論文集
巻号頁・発行日
vol.55, pp.70-71, 1997-09-24
被引用文献数
1

日本語校正支援システムFleCSは, 92年末頃より新聞社ユーザーの実務に用いられてきた。その中で表記揺れを扱うことはよくあったが, 例えば「コミュニケーション」と「コミュニケイション」, 「行う」と「行なう」のように, 正表記と誤表記が単語単位で決まっているようなものがほとんどであった。つまり, 後者を発見したら前者に修正を求めるように禁止語辞書を作っておけばだいたい用が足りていた。ところが, 昨年より弊社の作成するマニュアル文書の校正に用いるようになって, それだけでは不便なことが増えてきた。マニュアル文書の多くは英語からの翻訳文である。一つの英単語(「target」)の訳として複数の日本語(「宛先」 「目標」 「ターゲット」)がある場合がよくあるが, そのうちのどれかだけが正しいのではなくて, ひとまとまりの複合語や分野などの状況によって決まる(「target database name」は「宛先データベース名」, 「target application name」は「ターゲット・アプリケーション名」)。複合語は次々新しく作られ, 正表記の変更もある。なにより, 誤表記は翻訳者によりまちまち(「target database name」に対して「ターゲット・データベース名」 「宛先データベースの名前」など)なことから, とても禁止語辞書のような形では抑えきれない。そこで, 比較的よくメンテナンスされている『翻訳者用辞書』を元にして, なるべく手間をかけずに翻訳文における表記揺れを検出・訂正する目的で, 『翻訳揺れ検出』を作ったので報告する。
著者
脇田 早紀子 金子 宏
雑誌
情報処理学会研究報告自然言語処理(NL)
巻号頁・発行日
vol.1996, no.7(1995-NL-111), pp.27-32, 1996-01-19

日本語校正支援システムに対して、変換ミスを漏れなく指摘してほしいという要請は以前からあった。我々が作っていたシステムでは、パターンという校正知識記述法と誤用語辞書を利用して変換ミスを検出していたが、余計な警告を出さない方針に徹していたので検出率は変換ミスの50%程度であった。漏れなく警告するため同音異義語を持つ語をすべて警告することも考えられるが、警告数が多くなりすぎて実用的でない。そこで、回りの語・語列・品詞・品詞列などを手がかりに、正しい変換らしいものを除いて警告数を抑える仕組みを作った。本発表では、その辞書を過去の文書の蓄積から自動作成する試みについて述べる。
著者
脇田 早紀子 奥村 薫
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL)
巻号頁・発行日
vol.1993, no.79, pp.135-142, 1993-09-16
被引用文献数
2

日本語の場合、単純に見えるタイプミスでも機械に発見させようとするとけっこう難しい。タイプミスを検出するには、形態素解析を行いその失敗箇所を警告する方法が一般的だが、誤り文でも形態素解析ができてしまうことが多いので、この方法だけでは不十分である。本研究は、「形態素解析失敗」では発見できないミスタイプ文を発見することを目的としている。ミスタイプ文の特徴を記述した検出ルールの原型と、それを実用レベルにまで高めるために必要な修正作業について述べる。It is hard to make useful Japanese spell-checker. General way to detect typographical error is to regard failure of morphological analysis as the indicator of error position, but it's not perfect. In this paper, we propose rules to detect typographical error which can't be detected by the general method.