著者
安藤 真一 土井 伸一 村木 一至
雑誌
全国大会講演論文集
巻号頁・発行日
vol.47, pp.83-84, 1993-09-27
被引用文献数
2

近年、大量の電子化テキストが利用できるようになり、これらから有用な情報を得るための支援技術として要約や情報抽出が研究されている。要約技術には頻出するキーワード、文末表現、接続表現などを利用する手法がある。通常要約すべき主題はユーザの視点によって異なり、ユーザがこれを選べることが必要である。しかし、現在の要約技術では固定した視点からの情報しか提示することができない。一方、情報抽出技術は取り出すべき情報を予め詳細に定義し、これを正確に取り出す技術である。ここでは文章内容に対する視点を明確に定めているため、限られた空間内で情報を扱うことができる。このため情報抽出技術は一般的な意味解析やモデル化を必要とする要約技術に比べて実現性が高い。さらに、抽出すべき情報の種類を複数用意することにより、複数の明確な視点を提供できる要約技術として考えることができる。以上の観点から、我々は要約の基礎技術として、ある1つの視点からの情報を新聞記事から抽出する情報抽出システムVENIEXを試作した。本システムは抽出すべき分野に依存した語彙(以後、キーワードと呼ぶ)の知識を構文構造に応じて組み合わせることによって情報を抽出している。

言及状況

はてなブックマーク (1 users, 1 posts)

収集済み URL リスト