著者
難波 英嗣 国政 美伸 福島 志穂 相沢 輝昭 奥村 学
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL) (ISSN:09196072)
巻号頁・発行日
vol.2005, no.73, pp.67-74, 2005-07-22
被引用文献数
9

「日経平均株価」や「内閣支持率」のように数値が時間とともに常に変動するような情報のことを動向情報と呼ぶ。本稿では、動向情報の抽出を一種の複数文書要約であると考え、複数文書要約技術を用いて、あるトピックに関する複数の文書から動向情報を自動的に抽出し、グラフ化する手法について述べる。複数文書からの要約の作成は、様々な要素技術を組み合わせることで実現できる。こうした技術のひとつとして、我々は文書横断文間関係理論(CST)に着目する。CSTとは、Radevらが提唱している理論で、文書中の書く分の機能を特定し、文間の依存関係を特定する修辞構造理論(RST)を、文書間関係に拡張したものである。本研究では、CSTの一部を計算機上で実現し、それを用いてグラフ化に必要な数値情報と時間情報の抽出を行う。Trend information is defined as information obtained by synthesis and organization of temporal information such as cabinet approval ratings and stock movements. In this paper,we describe a method for visualizing trend information extracted from multiple documents. We focus on cross-dokument structure theory (CST) which Radev et al. proposed. The theory expands the notion of Rhetorical Structure Theory (RST) to the relationships between sentences in the different documents. We implement this theory partially,use it to extract trend information,and visualize it as a graph.
著者
難波 英嗣 国政 美伸 福島 志穂 相沢 輝昭 奥村 学
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション (ISSN:09135685)
巻号頁・発行日
vol.105, no.203, pp.67-74, 2005-07-15

「日経平均株価」や「内閣支持率」のように数値が時間とともに常に変動するような情報のことを動向情報と呼ぶ.本稿では, 動向情報の抽出を一種の複数文書要約であると考え, 複数文書要約技術を用いて, あるトピックに関する複数の文書から動向情報を自動的に抽出し, グラフ化する手法について述べる.複数文書からの要約の作成は, 様々な要素技術を組み合わせることで実現できる.こうした技術のひとつとして, 我々は文書横断文間関係理論(CST)に着目する.CSTとは, Radevらが提唱している理論で, 文書中の各文の機能を特定し, 文間の依存関係を特定する修辞構造理論(RST)を, 文書間関係に拡張したものである.本研究では, CSTの一部を計算機上で実現し, それを用いてグラフ化に必要な数値情報と時間情報の抽出を行う.