- 著者
-
山本 英子
梅村 恭司
- 出版者
- 一般社団法人 言語処理学会
- 雑誌
- 自然言語処理 (ISSN:13407619)
- 巻号頁・発行日
- vol.9, no.2, pp.45-75, 2002-04-10 (Released:2011-03-01)
- 参考文献数
- 25
- 被引用文献数
-
2
6
本論文では, コーパスから事象間の一対多関係を推定する問題を考える. これまでにコーパスから事象間の関係を推定することが多く研究されている. 一般に, この問題に対する解決法の多くは, コーパスを構成する文書における事象の共起に基づき, 暗黙的に事象間の関係は一対一関係であることを想定している. しかし, 実際には, 事象間の関係は一対多関係である場合があり, この特徴のためにいくつかの工夫が必要である. 本論文では, コーパス中の一対多関係を推定するために補完類似度を利用することを提案する. この尺度は本来文字認識システムのために開発され, テンプレートの文字のパターンにオーバーラップしたパターンがある条件で有効であることが知られているが, これまでテキスト処理に利用されたことはなかった. この補完類似度の一対多関係を推定する能力を評価するために, 地名 (都道府県市郡名) を対象事象とした実験において, 平均相互情報量, 自己相互情報量, 非対称平均相互情報量, ∅相関係数, コサイン関数ダイス相関係数, 信頼度との性能比較を行う. 実験では, 三種類のコーパスを用いる. 一つ目は実際に地名問にある一対多関係から合成する人工的なデータ集合である. 二つ目も実際の関係から合成するが, 誤った関係を導く少量の要素も含むデータ集合である. 三つ目は現実の新聞記事コーパスから得られるデータ集合である. これらの評価実験において, 補完類似度がもっとも優れており, 補完類似度は一対多関係の推定問題に対して有効であることを示す.