著者
山本 悠二 増山 繁
出版者
情報処理学会
雑誌
研究報告自然言語処理(NL) (ISSN:09196072)
巻号頁・発行日
vol.2010, no.7, pp.1-8, 2010-09-09

日本語係り受け解析の手法は大きく分けて,1. 決定的な解析方法と,2. 係り先候補の確信度に基づく解析方法がある.前者は係り先候補間の比較が行えないことから,特に長距離依存の係り先を同定するときに誤りを生じやすいという傾向がある.また,後者は係り先候補集合のすべての要素を探索するため,計算時間の点で問題がある.提案手法では,係り先候補の確信度に基づく解析方法での解析時間を減らすために,決定的な解析が容易な文節について先に係り先を定めた後に,相対的な比較による係り先の同定する方法を示す.京都テキストコーパス 4.0 を用いて提案手法を評価したところ,係り先候補の確信度に基づく解析方法の 1 つである相対モデルと比較してほぼ同等の解析性能を持ち,かつ,実行時間が 2.4 倍程度高速であることが確認された.Japanese dependency parsers fall into two main methods, 1) deterministic parsing and 2) parsing based on dependency certainties among modifee candidates. The former methods tend to make errors especially for identifying long-distance dependencies because these methods do not opt the candidate by comparing candidates. On the other hand, the latter methods have difficulty with their parsing speed due to searching the most preferable candidate from all modifee candidates. The proposed method identifies easily-analyzable dependencies by deterministic parsing and identifies the rest dependencies by parsing based on dependency certainties among modifee candidates later. Experiments using the Kyoto Text Corpus show that the proposed method runs 2.4 times faster than the relative-model parser while the dependency accuracy of the proposed method is nearly comparable with the relative-model's.

言及状況

Twitter (1 users, 1 posts, 0 favorites)

収集済み URL リスト