原田 実 田淵 和幸 大野 博之
情報処理学会論文誌 (ISSN:18827764)
vol.43, no.9, pp.2894-2902, 2002-09-15

原田研究室ではこれまで,EDR電子化辞書に記載された情報を元に,日本語文を意味解析し格フレーム群に自動変換するシステムSAGE(Semantic frame Automatic GEnerator)を開発してきた.既存のSAGEは機能的には正しく動作するが,解析時間が文節数の指数オーダのため実利用するには問題があった.また解析精度に対する客観的な検証がされていなかった.そこで本研究では,Jiriらによる英文の構文木への語意割当て用の高速アルゴリズムの考え方をSAGEにおける係り受け木への語意と格決定用に適用して,SAGEの解析速度を向上させた.この結果,解析速度は文節数の線形オーダになった.また,EDRの解析済みコーパスを用いてSAGEの解析精度を自動的に評価するシステムを開発した.その結果,語意正解率は81.1%,格正解率は60.7%,格の宛先正解率は73.3%であった.これによってSAGEは速度面でも精度面でも意味解析システムとして実利用を開始できるレベルに至ったといえる.In the Harada laboratory,a semantic analysis system SAGE (Semantic frame Automatic GEnerator) has been developed,which converts a Japanese sentence into case frames based on the statistical information in the EDR electronic dictionary.Though SAGE operated correctly,there was such a problem in actual use that it requires the time of the exponential order of the number of clauses.In this research,based on Jiri's deterministic algorithm for assigning the word meaning to nodes of the parse tree of English sentence,the deterministic algorithm for deciding the meaning of words represented by nodes and the deep case of the relations among such nodes in the dependency tree of Japanese sentence is developed.As a result, the analytical speed became the linear order of the number of clauses.Moreover,the system to evaluate the analytical accuracy of SAGE is developed by using EDR analyzed Corpus.This evaluation revealed that the word meaning accuracy is 81.1%,the destination accuracy of case relation is 73.3% and the case relation accuracy is 60.7%.As a result,it can be said that SAGE has reached to the level that we can begin its acctual use for Japanese semantic analysis.