著者
植野 剛
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.28, 2014

方策探索法は,方策をパラメトリック関数で記述し, そのパラメータを学習する強化学習法である.本研究では確率推論の立場から方策探索法を考察し,KL距離最小化に基づく新しい方策探索法を提案する.この提案法は大域的収束性を持つなど望ましい性質を持つが,周辺化が困難な確率分布を計算する必要がある.この問題を解決するため,確率分布の近似推論の1種であるe射影を用いた近似法も併せて提案する.