- 著者
-
白井 克彦
林 良彦
平田 裕一
久保田 淳市
- 出版者
- 一般社団法人情報処理学会
- 雑誌
- 情報処理学会論文誌 (ISSN:18827764)
- 巻号頁・発行日
- vol.26, no.4, pp.706-714, 1985-07-15
- 被引用文献数
-
3
日本語文の構造は 文の構文的・意味的な構造に大きく関わっている.よって 日本語文の処理を行う場合 その係り受け構造を明らかにすることが重要である.計算機により日本語文の係り受け解析を行う研究は広く行われているが そのために必要な知識の獲得・構造化を半自動的にかつ適応的に行うための研究は少ないように思われる.本論文では テキストデータに対する分析から直接的に以後の成長の核となる初期辞書データベースを構成する方法 および成長のための学習機能について検討した.この辞書データベース中では 単語はその係り受け特性に基づいてクラスタリングされ 分析対象としたテキスト中の単語間の係り受け関係は クラスタ間の係り受け可能関係として抽象化されて記述される.本辞書データベースは 実験文解析システムESSAYによる文解析に適用され その評価を受ける.さらに 解析が不成功である文において そのネガティブな状況より獲得される情報を用い 学習構造化の処理を受ける.このように 言語要素(単語等)の使われ方に基づいて知識の獲得を行うため 対象世界における拘束を緩やかに含んだ形の知識を得ることができる.また辞書データベースという記述的な形で構造化を行うため それ自身インクリメンタルに成長することが可能となった.