- 著者
-
梶 博行
森本 康嗣
相薗 敏子
山崎 紀之
飯田 恵子
内田 安彦
- 出版者
- 一般社団法人情報処理学会
- 雑誌
- 情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
- 巻号頁・発行日
- vol.1999, no.39, pp.97-104, 1999-05-17
- 被引用文献数
-
1
電子化されたテキスト情報の増加とともに情報アクセス技術の重要性が高まっている.本稿では,大規模テキストコーパスの探索を支援する,インタラクティブなテキストマイニングシステムを提案する.提案システムは,コーパスから関連シソーラスを自動生成し,コーパスに対応したシソーラスをナビゲーションできるようにする.関連タームのクラスタリング,シソーラスオーバビューの生成,オーバビューから詳細へのズームインという特徴機能によって,漠然とした情報要求しかもたないユーザや専門外のドメインの情報を求めているユーザでも,適切な情報を効率よく獲得することができる.プロトタイプの開発と新聞記事コーパスを用いた実験を通じて,提案システムの有効性を実証した.With the growing amount of textual information available in electronic form, information access technologies have become extremely important. This paper proposes an approach to interactive text mining that facilitates exploration through a large corpus of texts. The proposed system automatically generates an association thesaurus from a corpus, and enables users to navigate through this corpus-dependent thesaurus. Its novel functions, including the clustering of related terms, the generation of an overview of the thesaurus, and the zooming-in from the overview to the details of a specific part, allow users to get information efficiently even when their information needs are vague or they seek information in unfamiliar domains. The effectiveness of the system has been demonstrated through prototyping and an experiment with a newspaper article corpus.