著者
青野 雅樹 小林 メイ
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告マルチメディア通信と分散処理(DPS) (ISSN:09196072)
巻号頁・発行日
vol.2002, no.54, pp.79-84, 2002-06-06

近年ブロードバンドのインターネットの普及に伴い,巨大なデータの伝送や処理がネットワークを介して行うことが可能となってきた。同時に,横溢する巨大データに対する知的な処理(マイニング)の重要性が増してきた。本報告では,ベクトル空間モデルでモデル化された大規模文書データの次元削減手法による,情報検索,クラスタリング,および可視化について述べる。コンテンツ解析や理解を助けるために開発した,自動推奨する3つの軸(基底ベクトル)に投影してデータ表示したり,この3次元空間での回転・拡大縮小,平行移動といったアフィン変換操作が可能なProsciuttoと呼ばれるシステムに関しても言及する。We present a novel system, Prosciutto, for IR (Information Retrieval) and visualization of the contents of massive databases. The system has several notable features. One of the most useful is a similarity search based on vector space modeling. Another is a service to recommend three mutually perpendicular subspace coordinate axes in attribute space onto which document vectors can be projected and displayed for view to help users understand relationships between a query and database documents.