- 著者
-
三川 健太
後藤 正幸
- 出版者
- 公益社団法人 日本経営工学会
- 雑誌
- 日本経営工学会論文誌 (ISSN:13422618)
- 巻号頁・発行日
- vol.66, no.4, pp.335-347, 2016 (Released:2016-02-16)
- 参考文献数
- 24
入力データの統計的特徴を考慮した距離計量を学習するための手法としてDistance Metric Learnig(以下,計量距離学習)が提案されている.計量距離学習では,適切な制約条件のもとで,繰り返し法による最適化問題を解くことにより最適な計量行列を学習する.しかしながら,一般的な計量距離学習手法では繰り返し毎に固有値分解を行うアルゴリズムを採用していることが多く,学習データの次元数が増加した場合には計算量が大幅に増加し,現実的な時間で最適解を得ることが難しい.また,これらの手法では学習データ全体に対し唯一の計量行列の存在を仮定しているため,学習データの統計的特徴を考慮することが難しいという問題点も存在している.これらの問題点を改善するため,本研究ではカテゴリ毎に複数の計量行列の存在を仮定し,その学習方法について提案を行う.各カテゴリの計量行列導出時にはカテゴリ間の特徴の差異を考慮した定式化を行うとともに繰り返し法を用いずに最適解を得る方法についても述べる.提案手法により得られた計量行列は各カテゴリの統計的特徴を保持していると考えられるため,これらの情報を活用したデータの分類方法についても提案を行う.提案手法の有効性を,低次元密なデータセット,ならびに高次元スパースなデータセットを用いることで示す.