著者
大澤幸生 NelsEricBenson 谷内田 正彦
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告情報学基礎(FI)
巻号頁・発行日
vol.1996, no.88, pp.57-64, 1996-09-12
被引用文献数
1

学術論文のキーワード,特に,既存のどの分野に属するかではなく,著者が新しく主張したい内容を捕えたキーワードの抽出を行うための手法を提案する.本手法のポイントは,論文を意味の構造物と見なし,もしなければ論文が支離滅裂になってしまう,いわば柱に当たる単語を見つけることである.ある単語が,文書中の単語間の共起関係を描いたグラフを繋ぎ止める役割を果たし,文書全体を一つの流れとするような力の強さをその単語の文書全体にとっての重要度とみなし,重要度の高い一定個数の単語を求める.この手法を英語論文に対して適用し,その性能を評価する.The goal of this paper is to catch the newly invented concept in a technical paper. Such content can not be always featured by index terms which appear frequently in the text, because terms on which the author of a document assign strong importance do not always appear many times. Also, the main idea in a technical paper does not appear at a fixed position in the text which is structured as chaters or sections. In order to extract keywords which might appear less frequently but are more important for the author, we use KeyGraph, a graph representing the co-occurence among terms in the text. Keywords, or index terms are detedted as such that connect the overall KeyGraph of the overall document. We show some experimental results which show the performance of KeyGraph.