- 著者
-
松吉 俊
- 出版者
- 一般社団法人 言語処理学会
- 雑誌
- 自然言語処理 (ISSN:13407619)
- 巻号頁・発行日
- vol.21, no.2, pp.249-270, 2014
「誰がいつどこで何をする」という文に「ない」や「ん」,「ず」などの語が付くと,いわゆる否定文となる.否定文において,否定の働きが及ぶ範囲をスコープと呼び,その中で特に否定される部分を焦点と呼ぶ.否定の焦点が存在する場合,一般にその焦点の箇所を除いた文の命題は成立する.それゆえ,自然言語処理において,否定の焦点が存在するか,および,どの部分が否定の焦点になっているかを自動的に判定する処理は,含意認識や情報抽出などの応用処理の高度化のために必要な技術である.本論文では,否定の焦点検出システムを構築するための基盤として,日本語における否定の焦点をテキストにアノテーションする枠組みを提案し,構築した否定の焦点コーパスについて報告する.否定文において否定の焦点を判断するための基準を提案し,否定の形態素および焦点の部分にアノテーションすべき情報について議論する.否定の焦点の判断には,「は」や「しか」などのとりたて詞や前後の文脈などが手がかりとなるため,これらを明確にアノテーションする.我々は,提案するアノテーション体系に基づいて,楽天トラベルのレビューデータと『現代日本語書き言葉均衡コーパス』内の新聞を対象としてアノテーションコーパスを構築した.本論文では,コーパス内に存在する 1,327 の否定に対するアノテーション結果を報告する.