著者
岸本 貴之 高橋 治久 堀田 一弘
出版者
一般社団法人情報処理学会
雑誌
研究報告自然言語処理(NL) (ISSN:09196072)
巻号頁・発行日
vol.2009, no.2, pp.27-32, 2009-01-15

本稿では,日本語形態素解析の精度を,条件付確率場 (CRF) による係り受け解析を用いて,改善する方法を提案する.従来の確率モデルによる形態素解析は,一般的に,1 個または 2 個前までの単語の品詞情報の相関関係によって,最適な候補を絞り込むというやり方を行っていた.しかし,それだけでは解析できない事例が存在しており,もっと広い範囲での単語の相関や,構文関係などを考慮に入れたモデルを考える必要がある.本稿では,形態素解析結果の候補に対し,係り受け解析を行い,その尤度を最大にする形態素解析結果により係り受け解析を選択する方法が,精度改善に有効であることを,従来法との比較実験により示す.This paper presents a method of improving Japanese morphological analysis via Conditional Random Fields (CRFs) using the dependency analysis. Many existing probabilistic methods select a correct tokens by the correlation analysis between adjoining words and their part-of-speech. However, some instances cannot be correctly analyzed only with the correlation between adjoining words. In order to improve the accuracy, it would be needed to take into account correlation of words in wider range as well as syntactical features. We show that maximizing the likelihood of the dependency analysis for candidates of correct tokens improves the accuracy by computer experiments.