- 著者
-
竹内 孝
石黒 勝彦
木村 昭悟
澤田 宏
- 雑誌
- 情報処理学会論文誌数理モデル化と応用(TOM) (ISSN:18827780)
- 巻号頁・発行日
- vol.7, no.1, pp.71-83, 2014-03-28
行列分解には,観測行列に含まれる零要素の割合が大きくなるにつれて低ランク近似の汎化性能が低下する問題がある.本稿では,この問題を解決するための統計的機械学習アプローチとして複合非負値行列因子分解(Non-negative Multiple Matrix Factorization: NM2F)を提案する.NM2F は,観測行列と2つの補助行列の間に共通の潜在構造を仮定し,これらの行列を同時に分解する.本稿では,NM2F を非負値行列因子分解(Non-negative Matrix Factorization: NMF)の一般化として定式化し,補助関数法により一般化KLダイバージェンスを用いた場合のパラメータ推定法を示す.さらにNM2F は,ブロック未定義領域ありNMFとポアソン分布を用いた確率的生成モデルと等価であることを示す.人工データと実データを用いた実験から,NM2F と既存手法の汎化性能を比較し,NM2F の定量的な優位性を示す.また,実データを用いた実験では,NM2F が複数の行列から多角的な基底を抽出する定性的な利点を示す.Analyzing highly sparse data often results in poor generalizing performances of matrix factorization. To compensate data sparseness, in this paper, we introduce a novel machine learning technique called Non-negative Multiple Matrix Factorization (NM2F). NM2F factorizes multiple matrices simultaneously under a non-negative constraint. We formulate NM2F as a generalization of Non-negative Matrix Factorization (NMF) with the generalized Kullback-Leibler divergence. We derive multiplicative update rules for parameter estimation. We evaluate NM2F and other existing techniques in both the quantitative and qualitative ways. NM2F shows better performance than other techniques on both synthetic and real-world data sets.