著者
藤畑 勝之 志賀 正裕 森 辰則
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL)
巻号頁・発行日
vol.2001, no.86, pp.119-125, 2001-09-10
被引用文献数
1

本稿では,質問応答に用いる数量表現の取り扱いについて考察する.数値表現はそれ自身は単独では意味をなさず,どの事物のどの属性に関しての値であるかが判明して初めて有用な情報になり得る.そのため,それぞれの数値表現に関して,数値が対応する事物とどのような係り受け構造で結び付くかを考慮する必要がある.そこで,数量表現の出現する文脈について考察し,数値情報の構造を考慮した係り受けの制約と優先規則に基づく抽出規則を提案する.さらに新聞記事を対象とする実験により,本規則が数値情報を含む文書中から数値およびそれに付随する情報を抽出するうえで精度の向上に役立つことを示す.In this paper, we study the treatment of numerical expressions in question-answering systems. Numerical expressions themselves do not convey enough information, because they are only some attribute values. In combination with the objects and the attribute names, numerical expressions convey useful information. Therefore, we propose a set of extraction rules for numerical expressions, which extract numerical expressions along with the supplementary expressions. The set of rules consists of the constraints and preference rules of dependencies among numerical expressions and the supplementary expressions. An experiment of extraction we conducted with news paper articles shows that our rules are useful for improving the accuracy of extraction.