著者
山崎 毅文 パッザーニマイク
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告情報学基礎(FI)
巻号頁・発行日
vol.1995, no.87, pp.49-56, 1995-09-14
被引用文献数
4

概念シソーラスの構築は、機械翻訳、テキスト検索等自然言語処理システムにおいて重要なタスクである。本稿では、与えられた事例集合から、機械翻訳システム向け翻訳ルールの学習と概念シソーラスの構築とを同時に行なう手法を提案する。概念シソーラスの構築では、既存のシソーラスを利用しない場合/更新する場合の2つの手法を提案する。利用しない場合は、まず、帰納学習アルゴリズムの適用により翻訳ルールの学習を行なう。次に学習されたルールからカテゴリー間類似度行列を作成し、クラスタリング手法の適用により、シソーラスを構築する。シソーラスを更新する場合は、既存シソーラスを一旦カテゴリー間類似度行列に変換することにより、シソーラスを利用しない場合と同様の手法が適用できる。実験結果により、本手法で構築されたシソーラスが、機械翻訳タスクにおいて有用であることが確認された。This paper addresses the problem of constructing a semantic hierarchy for Japanese-English translation systems. The creation of a comprehensive hierarchy is one important step in this system because it is used to bias the learning of rules that indicate the English translation of Japanese verbs. We propose two methods of constructing a hierarchy: acquiring a hierarchy from scratch and updating a hierarchy. When acquiring a hierarchy from scratch, translation rules are learned by an inductive learning algorithm in the first step. A new hierarchy is then generated by applying a clustering method to internal disjunctions of the learned rules and new rules are learned under the bias of this hierarchy. When updating an existing manually-constructed hierarchy, we take advantage of its node structure. We report experimental results showing that the semantic hierarchies generated by our method yield learned translation rules with higher average accuracy.