著者
山本 喜大 久保田 淳市 庄田 幸恵 白井 豊
雑誌
情報処理学会研究報告自然言語処理(NL)
巻号頁・発行日
vol.1997, no.109(1997-NL-122), pp.105-111, 1997-11-20

日本語の入力操作全体での効率向上のために、かな漢字変換上に誤入力を訂正する機能を試作した。本かな漢字変換は、置換、挿入、脱落誤りのいずれかを一つ含む文節を訂正する。ユーザの訂正指示操作に応じて複数の誤り訂正候補を提示しユーザが選択する方法(選択型訂正)と、変換操作に応じて自動的に誤りを訂正する方法(自動訂正)の2つのインターフェースを想定し性能を評価した。実験の結果、選択型訂正の再現率は第1位が39%、上位6位までで59%であった。また自動訂正の再現率は4%、誤り率は3%であった。
著者
白井 克彦 林 良彦 平田 裕一 久保田 淳市
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.26, no.4, pp.706-714, 1985-07-15
被引用文献数
3

日本語文の構造は 文の構文的・意味的な構造に大きく関わっている.よって 日本語文の処理を行う場合 その係り受け構造を明らかにすることが重要である.計算機により日本語文の係り受け解析を行う研究は広く行われているが そのために必要な知識の獲得・構造化を半自動的にかつ適応的に行うための研究は少ないように思われる.本論文では テキストデータに対する分析から直接的に以後の成長の核となる初期辞書データベースを構成する方法 および成長のための学習機能について検討した.この辞書データベース中では 単語はその係り受け特性に基づいてクラスタリングされ 分析対象としたテキスト中の単語間の係り受け関係は クラスタ間の係り受け可能関係として抽象化されて記述される.本辞書データベースは 実験文解析システムESSAYによる文解析に適用され その評価を受ける.さらに 解析が不成功である文において そのネガティブな状況より獲得される情報を用い 学習構造化の処理を受ける.このように 言語要素(単語等)の使われ方に基づいて知識の獲得を行うため 対象世界における拘束を緩やかに含んだ形の知識を得ることができる.また辞書データベースという記述的な形で構造化を行うため それ自身インクリメンタルに成長することが可能となった.