- 著者
-
田部井 靖生
津田 宏治
- 出版者
- 一般社団法人電子情報通信学会
- 雑誌
- 電子情報通信学会技術研究報告. IBISML, 情報論的学習理論と機械学習 (ISSN:09135685)
- 巻号頁・発行日
- vol.111, no.87, pp.103-110, 2011-06-13
近年,データの大規模化に伴いバイナリコードを用いた類似度検索はますます重要度を増している.従来の空間分割に基づく手法(e.g., cover tree)とは異なり,数値ベクトルはハッシュテーブルにより効率的に扱うことができる離散シンボルへと変換され処理される.しかし,ハッシュテーブルに基づく手法はベクトル空間の幾何的性質を扱うことが困難であり既存の手法は必ずしも効率的とは言えない.そこで,本稿ではウェーブレット木(Grossi et al., SODA'03)によるバイナリコードの効率的な検索手法を提案する.提案手法は幾何的制約により探索空間を効率よく枝刈りすることができ,ハッシュテーブルを使った手法よりも効率的である.実験により,提案手法は約8000万の大規模画像データに対しても適応可能であることを示す.