- 著者
-
青野 雅樹
小林 メイ
- 出版者
- 一般社団法人情報処理学会
- 雑誌
- 情報処理学会研究報告マルチメディア通信と分散処理(DPS) (ISSN:09196072)
- 巻号頁・発行日
- vol.2002, no.54, pp.79-84, 2002-06-06
近年ブロードバンドのインターネットの普及に伴い,巨大なデータの伝送や処理がネットワークを介して行うことが可能となってきた。同時に,横溢する巨大データに対する知的な処理(マイニング)の重要性が増してきた。本報告では,ベクトル空間モデルでモデル化された大規模文書データの次元削減手法による,情報検索,クラスタリング,および可視化について述べる。コンテンツ解析や理解を助けるために開発した,自動推奨する3つの軸(基底ベクトル)に投影してデータ表示したり,この3次元空間での回転・拡大縮小,平行移動といったアフィン変換操作が可能なProsciuttoと呼ばれるシステムに関しても言及する。We present a novel system, Prosciutto, for IR (Information Retrieval) and visualization of the contents of massive databases. The system has several notable features. One of the most useful is a similarity search based on vector space modeling. Another is a service to recommend three mutually perpendicular subspace coordinate axes in attribute space onto which document vectors can be projected and displayed for view to help users understand relationships between a query and database documents.