著者
森 靖英 高橋 裕信 新田 義貴 岡 隆一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解
巻号頁・発行日
vol.98, no.274, pp.9-15, 1998-09-17
被引用文献数
1

互いにリンク付けられた画像・文章データベースをコアデータとして用いた画像理解方式を提案する.本方式では, 文書データは, 単語の共起関係に基づく非線形クラスタリングによって空間配置される.画像データも, その特徴量ベクトル抽出後, 同じく非線形クラスタリングによって, より低次元の特徴量空間に写像される.この際, 対応する文章の距離関係が埋め込まれる.両クラスタリングデータを用いて, 入力された未知画像は, クラスタリング空間において類似画像検索され, 検索された既知画像とリンクを持つ文章を用いて, その関連文が出力される.本報告では, 約8, 000対の画像・文書データを用いて, 未知画像からどの程度関連した文が出力されるか調べた.
著者
高橋 裕信 新田 義貴 遠藤 隆 岡 隆一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション
巻号頁・発行日
vol.97, no.330, pp.41-47, 1997-10-17

本報告ではテキストを時系列データと考える大規模なテキストデータベースを対象として, 単語を空間に配置し, 空間の距離を利用した文章の検索方式を提案する. まず, 形態素解析によって分節した単語をノードとして, 単語bigramの作るネットワークを構築する. 次にこのネットワークのノードを有限次元の空間中に, ノード群のクラスタリングを伴なう配置問題を考える. この配置問題は, 時系列方向での近傍共起性から, ノード間の距離を定義し, 有限の小さい次元の空間で効率よく分類 (クラスタリング) するために, 最適化関数を導入した非線形化した手法で解かれている. 本手法を新聞データベースのリアルタイム検索に適用した実験結果について述べる.