- 著者
-
工藤 拓
松本 裕治
- 出版者
- 一般社団法人情報処理学会
- 雑誌
- 情報処理学会論文誌 (ISSN:18827764)
- 巻号頁・発行日
- vol.43, no.6, pp.1834-1842, 2002-06-15
- 被引用文献数
-
147
76
本稿では,チャンキングの段階適用による日本語係り受け解析手法を提案し,その評価を行う.従来の係り受け解析は,任意の2文節間の係りやすさを数値化した行列を作成し,そこから動的計画法を用いて文全体を最適にする係り受け関係を求めるというモデルに基づくものが多かった.しかし,解析時に候補となるすべての係り関係の尤度を計算する必要があるため効率が良いとはいえない.本提案手法は,直後の文節に係るか係らないかという観点のみで決定的に解析を行うため,従来方法に比べ,モデル自体が単純で,実装も容易であり,高効率である.さらに,従来法では,個々の係り関係の独立性を前提としているが,本提案手法はその独立性を一部排除することが可能である.本提案手法を用い,京大コーパスを用いて実験を行った結果,従来法と比較して効率面で大幅に改善されるとともに,より高い精度を示した.In this paper, we propose a cascaded chunking method for Japanesedependency structure analysis. Conventional approachesmainly consist of two steps: First, the dependency matrix isconstructed, in which each element represents theprobability of a dependency. Second, an optimal combinationof dependencies are determined from the matrix. However,such a method is not always efficient since it needs tocalculate all the probabilities of candidates. Our proposedmodel is more simple and efficient, since it parses a sentence deterministically only deciding whether the current segment modifies segment on its immediate right hand side.In addition, proposed model does not assume the independence constraintin dependency relation. Experiments using the Kyoto UniversityCorpus show that the method outperforms previous systems as well as improves the parsing and training efficiency.